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La presente invention conceme la mise en evidence de nouvelles 
proteines humaines iixant les odeurs, ci-apres denommees « OBP » 
(Odorant Binding Proteins) ainsi que leurs applications, tant au niveau 
therapeutique que non therapeutique. 
5 La presente invention repose sur Tidentification d'une famille de 

genes de lipocalines composee de trois genes et de deux pseudogenes 
sur le chromosome humain 9q34 ; les trois genes correspondent au 
gene LCNl deja decrit et a deux nouveaux genes faisant I'objet de la 
presente invention et denommes hOBPIIa et hOBPIIb. De plus, 

10 rinvention repose sur Tattribution de nouvelles fonctions a des 
lipocalines humaines deja connues par la mise en evidence de 
nouveaux territoires d'expression. 

Bien qu\m certain nombre d'OBP ait deja ete mis en evidence 
(Pelosi et al., 1996), telle TOBP de rat par exemple (voir notamment le 

15 brevet EP-0 335 654), les OBP selon la presente invention sont des 
OBP humaines qui presentent un tres grand nombre d'avantages, 
comme cela ressortira de la suite du texte, par rapport aux proteines 
murines. 

Ces proteines OBP de la famille des lipocalines ont, pour 
20 certaines d'entre elles, ete mentionnees indirectement dans le brevet 
WO 99 07740, mais leur fonction d'OBP n'a jamais ete decrite jusqu'a 
present ; il en est ainsi egalement des proteines LCNl, retinol-binding- 
protein (RBP) et Apolipoproteine D (ApoD), comme cela sera explicite 
plus completement ci-apres, 
25 Historiquement, la famille des lipocalines (Pervaiz et Brew, 

1987) a ete definie a partir de la proteine humaine fixant le retinol 
(RBP) et a partir de 3 autres proteines : la p-lactoglobuline de boeuf, 
ra2n-globuline de rat et Tal-microglobuline humaine. A partir de ces 
proteines de reference et en utilisant des homologies de sequence, la 
30 famille des lipocalines s'est enrichie pour incorporer maintenant un 
grand nombre de proteines, plus d'une centaine, aussi bien chez les 



eucaryotes que chez les procaiyotes (Flower et al, 1995, 1996). Cette 
famiUe consiste en de petites proteines (160-190 acides amines) 
contenant une poche hydrophobe et qui sont g^neralement secretees 
(Bocskei et al., 1992 ; Senoo et al., 1990, Zeng et al., 1996 MiUer, 
5 1998), bien que dans certains cas il s'agisse de proteines qui restent 
associees a la membrane (Nagata et al., 1991). Chez les vertebres, les 
identites de sequence entre les differentes Upocalines toument autour 
de 20%, toutefois, les identites de sequences sont plus importantes 
pour les protaines orthologues, de meme que pour les recents genes 
10 paralogues decrits (Igarashi et al., 1992 ; Dewald et al, 1992). 

La presente invention conceme les polypeptides isol6s OBPII 
codes par les deux nouveaux gfines humalns OBPIIa et OBPIIb isoles 
localises au locus 9q34 ; I'invention conceme ^element les sequences 
polynucleotidiques correspondantes, les ARNm correspondants, ainsi 
15 que les sequences regulatrices promotrices qui determinent le profil 
d'expression dans les differents tissus et notamment dans les tissus 
secreteurs. Ces deux genes cedent pour au moins sept polypeptides 
differents 6tant donne I'existence d'6pissage altematif des transcrits. 
Le g6ne OBHIa code pour au moins 4 polypeptides differents 
20 d6nomm6s OBPIU , OBPIIap . OBPIL*, , OBPIU et le gene OBPIIb code 
pour trois polypeptides differents d€nomm6s OBPIIba, OBPIIbp, OBPIIbs- 
Meme si un gene est principalement exprime, toutes les formes de 
messagers sont retrouvees dans la structure nasale. 

La presente invention a done pour objet un polypeptide isole 
25 eomprenant une sequence en amino-acides ayant au moins 90% 
d'identite avec les sequences en amino-acides SEQ ID N''2, SEQ ID 
N''4, SEQ ID N»6, SEQ ID N°8, SEQ ID NnO, SEQ ID Nn2 ou SEQ ID 
N''14 et LCNl, ApoD et RBP. 

II doit etre compris que I'invention conceme les polypeptides 
30 obtenus par purification a partir de sources naturelles ou bien obtenus 
par les techniques recombinantes, comme cela sera ddcrit dans ce qui 



va suivre; I'invention conceme egalement les polypeptides obtenus par 
synthase chimique qui peuvent alors comporter des acides amines non 
naturels. Dans la presente description, on utilisera le terme 
polypeptide pour designer egalement une proteine ou un peptide. 

Par pourcentage d'identitc entre les sequences, on entend 
designer le pourcentage d'acides amines identiques entre les sequences 
obtenu avec le meilleur alignement de sequences possibles. Ce 
pourcentage 6tant purement statistique et les diiKrences entre les 
polypeptides etant rgparties au hasard et sur toute la longueur. 

La pr€sente invention conceme 6galement un polypeptide isole 
caracterise en ce qull comprend un polypeptide choisi parmi : 

a) un polypeptide de sequence SEQ ID N»2, SEQ ID N''4, SEQ 
ID N-e, SEQ ID N"8, SEQ ID NnO, SEQ ID N''12 ou SEQ ID Nn4; 

b) un polypeptide variant de polypeptide de sequences d'acides 
amines deiini en &) ; 

c) un polypeptide homologue au polypeptide defini en a) ou b) et 
comportant au moins 90 % dldentite avec ledit polypeptide de a) ; 

d) un fragment d'au moins 15 acides amines consecutifs d'un 
polypeptide d6fini en aj, b) ou c) ; 

e) un fragment biologiquement actif d*un polypeptide defini en 
a], b) ou c). 

On entendra par polypeptide variant I'ensemble des 
polypeptides mutes pouvant exister naturellement, en particuUer chez 
I'etre humain, et qui correspondent notamment a des troncatures, 
substitutions, deletions et/ou additions de residus d'amino-acides. Les 
polypeptides variants selon llnvention conservent au moins un 
domaine de fixation §l un ligand hydrophobe. 

Par polypeptide homologue, on entendra designer les 
polypeptides prSsentant, par rapport aux polypeptides de sequence 
SEQ ID N»2, SEQ ID NM, SEQ ID N°6, SEQ ID N^S, SEQ ID NUO, SEQ 
ID N"12 et SEQ ID N°14, certaines modifications comme en particulier 




une deletion, addition ou substitution d'au moins un acide amine, une 
troncature, un allongement et/ou une fusion chimerique. Parmi les 
polypeptides homologues, on prefere ceux dont la sequence d'acides 
amines presente au moins 90 % d'identite, de pr6ference 95 %, de 
5 maniere preferee 97 %, et de maniere encore preferee 99 % d'identite 
avec les sequences d'acides amines des polypeptides selon Tinvention. 
Dans le cas d'une substitution, un ou plusieurs acides amines 
consecutifs ou non consecutifs, sont remplaces par des « acides amines 
equivalents ». L'expression « acide amine equivalent » vise ici a designer 

10 tout acide amine susceptible d'etre substitue a l*un des acides amines 
de la structure de base sans cependant modifier les caracteristiques ou 
proprietes fonctionnelles essentielles des polypeptides correspondants, 
leurs activites biologiques, telles par exemple I'induction in vivo 
d'anticorps capables de reconnaJtre le polypeptide dont la sequence 

15 d'acides amines est comprise dans la sequence d'acides amines SEQ 
ID N^2, SEQ ID N°4, SEQ ID N^6, SEQ ID N^'S, SEQ ID N^O, SEQ ID 
N''12 ou SEQ ID N*'14, ou Tun de ses fragments. Ces acides amines 
equivalents peuvent etre deteraiines soit en s'appuyant sur leur 
homologie de structure avec les acides amines auxquels ils se 

20 substituent, soit sur les resultats des essais d'activite biologique 
croisee auxquels les differents polypeptides sont susceptibles de 
donner lieu. A titre d'exemple, on mentionnera les possibilites de 
substitutions susceptibles d'etre effectuees sans qu'il en resulte une 
modification approfondie des activites biologiques des pol3^eptides 

25 modifies correspondants, les remplacements, par exemple, de la 
leucine par la valine ou Tisoleucine, de Tacide aspartique par Tacide 
glutamique, de la glutamine par Tasparagine, de Targinine par la lysine 
etc., les substitutions inverses etant naturellement envisageables dans 
les memes conditions. Ainsi, on peut envisager dtatroduire certaines 

30 modifications conmie en particulier une deletion, addition ou 
substitution d'au moins un acide amine au niveau des helices alpha de 
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la proteine sans ddtruire le calice forme par la structure composee des 
feuillets beta ; de la m6me maniere, il est possible d'introduire des 
amino-acides equivalents qui pemiettent de conserver aux feuillets 
beta le caractere hydrophobe. II peut egalement etre int6ressant 
5 d'introduire des modifications dans la sequence des polypeptides de 
I'invention pour generer des polypeptides homologues depourvus de 
sites proteasiques. 

Par fragment biologiqucment actif, on entendra designer en 
particulier un fragment de sequence d'acides amines de polypeptide ^ 
10 selon I'invention pr6sentant au moins une des caracteristiques ou 
propriStes fonctionneUes des polypeptides selon Invention, 
notamment en ce que : (i) il est capable d'etre reconnu par un 
anticorps specifique d*un polypeptide selon I'invention ou bien par des 
anticorps produits par des patients au cours d*une reaction 
15 immunitaire; (ii) il presente au moins Tun des domaines ou regions tels 
que definis ci-apres ; (iii) il est capable de lier un ligand hydrophobe et 
notamment des molecules odorantes, de preference les pheromones ; 
(iv) il est capable de lier specifiquement un recepteur. 

Par fragment de polypeptide, on entend designer un polypeptide 
20 comportant au minimun 15 acides amines, de preference 18 acides ^ 
amines, de maniere preferee 25 et de maniere encore pr6f6r6e 50 
acides amines. Les fragments de polypeptide selon Invention obtenus 
par clivage dudit polypeptide par une enayme proteolytique, par un 
reactif chimique, ou encore en plagant ledit polypeptide dans un 
25 environnement tres acide font egalement partie de I'invention. Lorsque 
Ton souhaite utiliser une sequence de 15, 18, 25 ou de 50 amino- 
acides, il s'agit bien entendu, de preference, des parties correspondant 
a des epitopes fonctionnels des polypeptides precedents, lesquels 
pourront etre integres dans un polypeptide ayant une structure plus 
30 longue sous forme par exemple de proteine de fusion, ceci ddpendra 
des applications que Ton souhaite de ces polypeptides. 



Selon un mode prti^re de realisation, la presente invention 
conceme un polypeptide isole s^lectionne parmi un polypeptide 
correspondant a la sequence SEQ ID N"2 et denomme OBPIUa , a la 
sequence SEQ ID N°4 et denomme OBPIIap , a la sequence SEQ ID N^e 
5 et denomme OBPIIar , a la sequence SEQ ID N'lO et denomme OBPHbo, 
k la sequence SEQ ID N" 12 et denomme OBPIIbp . 

Les polypeptides selon I'invention se caracterisent en ce qu^s 
component de preference le domaine Gly-Thr-Trp-Tyr. 

L'invention conceme 6galement le polynucleotide isole 
10 caracteris6 en ce qu*il code pour un polypeptide tel que decrit 
precedemment. Le polynucleotide selon I'invention est dioisi parmi le 
polynucleotide de sequence SEQ ID N" 1, SEQ ID N" 3 , SEQ ID N° 5, 
SEQ ID N*"?, SEQ ID N°9, SEQ ID Nm ou SEQ ID N° 13. 

L'invention porte egalement sur un pol3miucleotide isole 
15 caracterise en ce qull comprend un polynucleotide choisi parmi : 

a) un polynucleotide de sequence SEQ ID N" 1, SEQ ID 3 , 
SEQ ID 5, SEQ ID N°7, SEQ ID N'Q, SEQ ID Nm ou SEQ ID 13 
ou dont la sequence est celle de TARN correspondant a. la sequence 
SEQ ID N° 1, SEQ ID N' 3 , SEQ ID 5, SEQ ID N'T, SEQ ID N'^g, 

20 SEQ ID N*»l 1 ou SEQ ID N» 13 ; 

b) un pol3aiucleotide dont la sequence est compiementaire de la 
sequence d'un polynucleotide defini en a), 

c) un polynucleotide dont la sequence comporte au moins 80% 
dldentite, de preference 90 %, de mani^re preferee 95 %, et de maniere 

25 encore preferee 97 % dldentite avec un polynucleotide defini en a) ou 
b), 

d) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en a), b) ou c), 

e) un fragment d'au moins 15 nucleotides consecutifs, de 
30 preference 21 nucleotides consecutifs, et de maniere preferee 30 

nucleotides consecutifs d'un polynucleotide defini en a), b), c) ou d). 




Dans la presente description, on entendra designer par 
polynucleotide, oligonucleotide, sequence de polynucleotide, sequence 
nucleotidique ou acide nucleique un fragment d'ADN, aussi bien un 
ADN double brin, un ADN simple brin que des produits de 
5 transcription desdits ADN, et/ou un fragment dARN, lesdits fragments 
naturels isoles, ou de synthese, comportant ou non des nucleotides 
non naturels, designant un enchainement precis de nucleotides, 
modifies ou non, permettant de definir un fragment ou une region dHin 
acide nucleique. 

10 Par polynucleotide de sequence complementaire, on entend 

designer tout ADN dont les nucleotides sont complementaires de ceux 
de la SEQ ID W 1, SEQ ID 3 , SEQ ID 5, SEQ ID N**7, SEQ ID 
N^9, SEQ ID N**ll, SEQ ID N** 13 ou d'une partie de la SEQ ID 1, 
SEQ ID 3 , SEQ ID N° 5, SEQ ID N°7, SEQ ID N"9, SEQ ID NUl, 

15 SEQ ID 13 et dont rorientation est inverses 

Par pourcentage d'identite au sens de la presente invention, on 
entend un pourcentage de bases identiques entre les polynucleotides 
obtenus apres le meilleur alignement, ce pourcentage etant purement 
statistique et les differences entre les deux polynucleotides 6tant 

20 reparties au hasard et sur toute leur longueur. 

Une hybridation dans des conditions de forte stringence 
signifie au sens de la presente invention, que les conditions de 
temperature et de force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de ITiybridation entre deux fragments d'ADN 

25 complementaires, A titre illustratif, des conditions de forte stringence 
de Tetape dTiybridation aux fins de definir les fragments 
polynucleotidiques decrlts ci-dessus, sont avantageusement les 
suivantes : 

Lliybridation ADN-ADN ou ADN-ARN est realisee en deux 
30 etapes: (1) prehybridation a 42**C pendant 3 heures en tampon 
phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond a 
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une solution 0,15 M NaCl + 0,015 M citrate de sodium), 50 % de 
foraiajnide, 7 % de sodium dodecyl sulfate (SDS), 10 x Denhard's, 5 % 
de dextran sulfate et 100 ^g/ml d'ADN de sperme de saumon ; (2) 
hybridation proprement dlte pendant 20 heures a une temperature 
5 dependant de la taille de la sonde (i.e. : 42°C, pour une sonde de taille 
> 100 nucleotides) suivie de 2 lavages de 20 minutes a 20"'C en 2 x 
SSC + 2 % SDS, 1 lavage de 20 minutes a 20"'C en 0,1 x BSC + 0,1 % 
SDS. Le dernier lavage est pratique en 0,1 x SSC + 0,1 % SDS pendant 
30 minutes a eO'C pour une sonde de taille > 100 nucleotides. Les 
10 conditions dTiybridation de forte stringence decrites ci-avant pour un 
polynucleotide de taille definie, seront adaptees par lliomme du metier 
pour des oligonucl6otides de taille plus grande ou plus petite, selon 
I'enseignement de Sambrook et al.( 1989). 

Avantageusement, un fragment nucleotidique repondant & la 
15 definition precedente aura au moins 15 nucleotides consecutifs, de 
preference au moins 21 nucleotides, et encore plus preferentiellement 
au moins 30 nucleotides consecutifs de la sequence dont il est issu. 

Selon un mode de realisation de llnvention, le polynucleotide 
selon I'invention se caracterise en ce qu'il est marque directement ou 
20 indirectement par un compose radioactif ou un compose non 
radioactif. Le polynucleotide selon I'invention est utilise en tant 
qu'amorce pour I'amplification ou la polymerisation de sequences 
nucleiques ; I'invention porte egalement sur I'utilisation d*un 
polynucleotide selon I'invention en tant que sonde pour la detection de 
25 sequences nucleiques. Selon I'invention, les fragments de 
polynucleotides pouvant etre utilises comme sonde ou comme amorce 
dans des precedes de detection, d'identification, de dosage ou 
d'amplification de sequence nucieique, presenteront une taille 
minimale de 9 bases, de preference de 18 bases, et de maniSre plus 
30 preferee 36 bases. Enfin, I'invention porte sur I'utilisation d*un 
polynucleotide selon I'invention en tant que oligonucleotide sens ou 




antisens pour controler Texpression du produit proteique 
correspondant en Foccurence un polypeptide selon rinvention. 

Les sequences de polynucleotides selon rinvention non 
marquees peuvent etre utilisees directement comme sonde, amorce ou 
5 oligonucleotide ; cependant les sequences utilisees sont generalement 
marquees pour obtenir des sequences utilisables pour de nombreuses 
applications. Le marquage des amorces, des sondes, des 
oligonucleotides selon rinvention est realise par des Elements 
radioactifs ou par des molecules non radioactives ; parmi les isotopes ^ 

10 radioactifs utilises, on peut citer le 32p, le 33p^ 353, le ajj ou le "si, 
Les entites non radioactives sont s61ectionn6es parmi les ligands tels la 
biotine, I'avidine, la streptavidine, la dioxygenine, les haptdnes, les 
colorants, les agents luminescents tels que les agents 
radioluminescents, chemiluminescents, bioluminescents, fluorescents, 

15 phosphorescents. 

L'invention comprend egalement une methode de detection 
et/ou de dosage d'acide nucleique selon l'invention, dans un 
echantillon biologique, caracterisd en ce quil comporte les etapes 
suivantes : (i) dfeolement de I'ADN a partir de I'^chantillon biologique a 

20 analyser, ou obtention d'un ADNc a partir de I'ARN de rtehantillon ^ 
biologique ; (ii) d'amplification specifique de I'ADN codant pour le 
polypeptide selon l'invention a I'aide d'amorces ; (iii) d'analyse des 
produits d'amplification. 

L'invention comprend en outre un necessaire pour la detection 

25 et/ou le dosage d'un acide nucleique selon l'invention, dans un 
echantillon biologique, caracterise en ce qu'U comprend les elements 
suivants : (i) un couple d'amorces nucieiques selon l'invention, (ii) les 
reactifs necessaires pour effectuer une reaction d'amplification d'ADN, 
et eventuellement (iii) un composant permettant de verifier la sequence 

30 du fragment amplifie, plus particulierement une sonde selon 
rinvention. 
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L*invention comprend aussi une methode de detection et/ou de 
dosage d'acide nucleique selon Tinvention, dans un echantillon 
biologique, caracterise en ce qu'il comporte les etapes suivantes : (i) de 
mise en contact d*une sonde selon Tinvention avec un echantillon 

5 biologique ; (ii) de detection et/ou de dosage de ITiybride fonne entre 
ladite sonde et TADN de Techantillon biologique. 

L'invention comprend egalement un necessaire pour la 
detection et/ou le dosage d'acide nucleique selon Tinvention, dans un 
echantillon biologique, caracterise en ce qu'il comprend les elements 

10 suivants : (i) une sonde selon I'invention, (ii) les reactifs necessaires a 
la mise en oeuvre d'une reaction dliybridation, et le cas echeant, (iii) 
un couple d'amorces selon Tinvention, ainsi que les reactifs 
necessaires a une reaction d'amplification de TADN. 

L'invention conceme particulierement les precedes selon 

15 rinvention et decrits ci-dessus, pour la detection et le diagnostic de 
cellules d'origine cancereuse et principalement cancers du sein, de 
Tuterus, de Tovaire, de la prostate et du poumon. 

Les polynucleotides selon Tinvention peuvent ainsi etre utilises 
comme amorce et/ou sonde dans des precedes mettant en oeuvre 

20 notanmient la technique PGR (reaction en chaine a la 
polymerase)(ErUch, 1989 ; Innis et al., 1990, et Rolfs et cd., 199 1), 
Cette technique necessite le choix de paires d'amorces 
oligonucleotidiques encadrant le fragment qui doit etre amplifie. On 
peut, par example, se referer a la technique decrite dans le brevet 

25 americain U.S. N** 4 683 202. Les fragments amplifies peuvent etre 
identifies, par exemple apres une electrophorese en gel d'agarose ou de 
polyaciylamide, ou apres une technique chromatographique comme la 
filtration sur gel ou la chromatographic echangeuse d'ions. La 
specificite de Tamplification peut etre controlee par hybridation 

30 moleculaire en utiUsant conmie sonde les sequences nucleotidiques de 
polynucleotides de Tinvention, des plasmides contenant ces sequences 
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ou leurs produits d'amplification. Les fragments nucleotidiques 
amplifies peuvent etre utilises comme reactifs dans des reactions 
dliybridation afin de mettre en evidence la presence, dans un 
echantillon biologique, d'un acide nucleique cible de sequence 
5 complementaire a celle desdits fragments nucleotidiques amplifies. 

L'invention vise egalement les fragments nucleotidiques 
susceptibles d'etre obtenus par amplification a I'aide d'amorces selon 
rinvention. 

D'autres techniques d'amplification de Tacide nucleique cible ^ 

10 peuvent etre avantageusement employees comme altemative a la PGR 
(PCR-like) a Taide de couple d'amorces de sequences nucleotidiques 
selon rinvention. Par PCR-like on entendra designer toutes les 
methodes mettant en oeuvre des reproductions directes ou indirectes 
des sequences d'acides nucleiques, ou bien dans lesquelles les 

15 systemes de marquage ont ete amplifies, ces techniques sont bien 
entendu connues, en general il s'agit de I'amplification de TADN par 
une polymerase ; lorsque Techantillon d'origine est un ARN il convient 
prealablement d'effectuer une transcription inverse, II existe 
actuellement de tres nombreux procedes permettant cette 

20 amplification, comme par exemple la technique SDA (Strand ^ 
Displacement Amplification) ou technique d'amplification a 
deplacement de brin (Walker et cd,, 1992), la technique TAS 
(Transcription-based Amplification System) decrite par Kwoh et cd. en 
1989, la technique 3SR (Self-Sustained Sequence Replication) decrite 

25 par Guatelli et cd. en 1990, la technique NASBA (Nucleic Acid Sequence 
Based Amplification) decrite par Kievitis et cd. en 1991, la technique 
TMA (Transcription Mediated Amplification), la technique LCR (Ligase 
Chain Reaction) decrite par Landegren et cd. en 1988 et perfectionnee 
par Barany et cd. en 1991, qui emploie une ligase thermostable, la 

30 technique de RCR (Repair Chain Reaction) decrite par Segev en 1992, 
la technique CPR (Cycling Probe Reaction) decrite par Duck et cd. en 
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1990, la technique d'amplification a la Q-beta-replicase decrite par 
Miele et al. en 1983 et perfectionnee notamment par Chu et cd. en 1986 
et Lizardi et cd. en 1988, puis par Bui^ et al. (1996) ainsi que par Stone 
etal. (1996). 

5 Dans le cas ou le polynucleotide cible a detecter est un ARN, 

par exemple un ARNm, on utilisera avantageusement, prealablement a 
la mise en oeuvre d'une reaction d'amplification a Taide des amorces 
selon rinvention ou a la mise en oeuvre d'un procede de detection a 
Taide des sondes de Tinvention, une enzyme de type transcriptase 

10 inverse afin d'obtenir un ADNc a partir de TARN contenu dans 
Techantillon biologique. L'ADNc obtenu servira alors de cible pour les 
amorces ou les sondes mises en oeuvre dans le procede d'amplification 
ou de detection selon Tinvention. 

Les sondes nucleotidiques selon Tinvention hybrident 

15 specifiquement avec une molecule dADN ou dARN de polynucleotide 
selon rinvention, plus particulierement avec les sequences SEQ ID N** 
1, SEQ ID N** 3 , SEQ ID 5, SEQ ID N"7, SEQ ID N*'9, SEQ ID N'll 
et SEQ ID 13, dans des conditions dTiybridation de forte stringence 
telles que donnees sous forme d'exemple precedemment. 

20 La technique dTiybridation peut etre realisee de manieres 

diverses (Matthews et al, 1988), La methode la plus generale consiste 
a immobiliser Tacide nucleique extrait des cellules de differents tissus 
ou de cellules en culture sur un support (tel que la nitrocellulose, le 
nylon, le polystyrene) et a incuber, dans des conditions bien definies, 

25 Tacide nucleique cible immobilise avec la sonde. Apres ITiybiidation, 
Texces de sonde est elimine et les molecules hybrides formees sont 
detectees par la methode appropriee (mesure de la radioactivite, de la 
fluorescence ou de Tactivite enzymatique liee a la sonde). 

Selon un autre mode de mise en oeuvre des sondes nucleiques 

30 selon rinvention, ces demieres peuvent etre utilisees comme sonde de 
capture, Dans ce cas, une sonde, dite « sonde de capture », est 
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immobilisee sur un support et sert a capturer par hybridation 
specifique Tacide nucleique cible obtenu a partir de rechantillon 
biologique a tester et Tacide nucleique cible est ensuite detecte grace a 
une seconde sonde, dite « sonde de detection ^, marquee par un 
5 element facilement detectable. 

Dans un mode prefere de realisation, Tinvention comprend 
Tutilisation d'un oligonucleotide sens ou antisens pour controler 
Texpression du produit proteique correspondant. Parmi les fragments 
d'acides nucleiques interessants, il faut citer en particulier les ^ 

10 oligonucleotides anti-sens, c'est-a-dire dont la structure assure, par 
hybridation avec la sequence cible, une inhibition de Texpression du 
produit correspondant, II faut egalement citer les oligonucleotides sens 
qui, par interaction avec des proteines impliquees dans la regulation 
de Texpression du produit correspondant, induiront soit une 

15 inhibition, soit une activation de cette expression. Les oligonucleotides 
selon rinvention presentent une taille minimale de 9 bases, de 
preference de 18 bases, et de maniere plus preferee 36 bases. 

^invention conceme un vecteur recombinant de clonage d\in 
polynucleotide selon Tinvention et/ou d'expression d*un polypeptide 

20 selon rinvention caracterise en ce qu'il contient un polynucleotide ^ 
selon rinvention tel que precedemment decrit. Le vecteur selon 
^invention est caracterise en ce qu'il comporte les elements permettant 
Texpression desdites sequences dans une cellule hote et 
eventuellement la secretion desdites sequences hors de la cellule hote. 

25 Par « vecteur d'expression », on entend aussi bien des vecteurs 
d'expression a replication autonome du type plasmide que des 
systemes destines a assurer Tintegration dans les cellules, mais ces 
vecteurs d'expression pourront etre egalement des vecteurs 
d'expression de type viral ou bien meme, lorsque Ton souhaite realiser 

30 par exemple de la therapie genique, de TADN nu. Parmi les vecteurs 
viraux, on prefere ceux derives de Tadenovirus, du virus associe a 




Tadenovirus (AAV), de retrovirus, des lentivirus, et de preference les 
derives de HIV, des poxvirus, du virus de ITierpes pour Texpression en 
systeme eucaryote. Parmi les vecteurs non viraux, on prefere les 
polynucleotides nus tels que TADN nu ou TARN nu selon la technique 

5 developpee par la societe VICAL, les chromosomes artificiels de levure 
(YAC, yeast artificial chromosome) pour Texpression dans la levure, les 
chromosomes artificiels de souris (MAC, mouse artificial chromosome) 
pour Texpression dans les cellules murines et de maniere prefere les 
chromosomes artificiels dTiomme (HAC, human artificial chromosome) 

10 pour Texpression dans les cellules humaines. 

Selon un mode particulier de realisation, le vecteur selon 
rinvention comporte des elements de controle de I'expression des 
pol5T5eptides ; ces elements de controle sont choisis de preference 
parmi (i) la sequence promotrice du gene hOBPIIa selon Tinvention qui 

15 correspond a la sequence SEQ ID N^'IS et/ou parmi la sequence 
promotrice du gene hOBPIIb selon Tinvention qui correspondant a la 
sequence SEQ ID N'^ie ; (ii) un polynucleotide dont la sequence est 
complementaire a la sequence SEQ ID 15 et SEQ ID 16 ; (iii) un 
polynucleotide dont la sequence comporte au moins 80% d'identite 

20 avec un polynucleotide defini en (i) ou (ii) ; (iv) un polynucleotide 
hybridant dans des conditions de forte stringence avec la sequence de 
polynucleotide defmie en (i), (ii), (iii). Les outils informatiques a la 
disposition de ITiomme du metier lui permettent aisement d'identifier 
les boites regulatrices promotrices necessaires et suffisantes au 

25 controle de Texpression genique, notamment les boites TATA, CCAAT, 
GC, ainsi que les sequences regulatrices stimulatrices (« enhancer ») ou 
inhibitrices (« silencers ») qui controlent en CIS Texpression des genes 
selon rinvention ; parmi ces sequences regulatrices, il convient de citer 
IIRE, MRE, CRE. 
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II est egalement dans Tetendue de rinvention d'utiliser les 
elements ci-dessus definis et choisis parmi la sequence SEQ ID N^'IS 
et/ou SEQ ID N**16 pour controler I'expression de polypeptides 
hfeterologues autres que ceux de Tinvention et notamment pour diriger 
5 Texpression de polypeptides heterologues dans les types cellulaires 
dans lesquels les polypeptides selon Tinvention s'expriment 
normalement. 

L'invention comprend en outre les cellules hotes, notamment 
les cellules eucaiyotes et procaryotes, caracterisees en ce qu'elles sont ^ 

10 transfomiees par les vecteurs selon Tinvention. De prefference, les 
cellules hotes sont transformees dans des conditions permettant 
Texpression d'un polypeptide recombinant selon Tinvention. LTiote 
cellulaire peut etre choisi pamii les cellules bacteriennes mais 
egalement parmi les ceUules de levure, de meme que parmi les cellules 

15 vegetales et animales ; de preference, ITiote cellulaire est une cellule de 
mammiferes (Ekiwards et Aruffo, 1993), mais egalement une cellule 
d'insectes dans laquelle on peut utiliser des procedes mettant en 
oeuvre des baculovirus par exemple (Luckow, 1993). Ces cellules 
peuvent etre obtenues par' Tintroduction dans des cellules botes d*une 

20 sequence nucleotidique inseree dans un vecteur tel que deflni ci- ^ 
dessus, puis la mise en culture desdites cellules dans des conditions 
permettant la replication et/ou Texpression de la sequence 
nucleotidique trahsfectee. 

Selon un mode particulier de realisation, Tinvention porte 

25 egalement sur un animal ou une plante transgenique qui comporte des 
cellules hotes selon Tinvention. 

L'invention concerae egalement une methode de preparation 
d*un polypeptide caracterise en ce qu'il met en oeuvre un vecteur selon 
rinvention. Plus particulierement, rinvention porte sur une methode de 

30 preparation d'un polypeptide recombinant caracterise en ce que Ton 
cultive des cellules transformees selon rinvention dans des conditions 
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peraiettant Texpression dudit polypeptide recombinant et que Ton 
recupere ledit polypeptide recombinant. 

Le polypeptide selon Tinvention est susceptible d'etre obtenu 
selon un precede de Tinvention et selon les techniques de production 

5 de polypeptides recombinants connues de lliomme du metier. La. 
presente invention conceme done le polypeptide recombinant 
susceptible d'etre obtenu par la methode ci-dessus presentee. Dans ce 
cas, la sequence d'acide nucleique utilisee est placee sous le controle 
de signaux permettant son expression dans un hote cellulaire. Un 

10 systeme efiicace de production d*un polypeptide recombinant necessite 
de disposer d'un vecteur, par exemple d'origine plasmidique ou virale, 
et d'une cellule hote compatible. Le vecteur doit comporter un 
promoteur, des signaux d'initiation et de terminaison de la traduction, 
ainsi que des regions appropriees de regulation de la transcription. II 

15 doit pouvoir etre maintenu de fagon stable dans la cellule et peut 
eventuellement posseder des signaux particuliers specifiant la 
secretion du polypeptide traduit. Ces differents signaux de controle 
sont choisis en fonction de ITiote cellulaire utilise. A cet effet, les 
sequences d'acide nucleique selon Tinvention peuvent etre inserees 

20 dans des vecteurs a replication autonome au sein de ITiote choisi, ou 
des vecteurs integratifs de lliote choisi. De tels vecteurs seront 
prepares selon les methodes couramment utilisees par ITiomme du 
metier, et les clones en resultant peuvent etre introduits dans un hote 
approprie par des methodes standards telles par exemple la 

25 transfection par precipitation au phosphate de calcium, la lipofection, 
I'electroporation, le choc thermique. 

Les polypeptides recombinants obtenus comme indique ci- 
dessus, peuvent aussi bien se presenter sous forme glycosylee que non 
glycosylee et peuvent presenter ou non la structure tertiaire naturelle. 

30 Les polypeptides obtenus par synthese chimique et pouvant 

comporter des acides amines non naturels correspondant auxdits 
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polypeptides recombinants, sont egalement compris dans Tinvention. 
Les peptides selon Tinvention peuvent egalement etre prepares par les 
techniques classiques, dans le domaine de la synthese des peptides. 
Cette synthese peut etre realisee en solution homogene ou en phase 
5 solide. 

Les precedes de purification de polypeptide recombinant 
utilises sont connus de ITiomme du metier. Le polypeptide 
recombinant peut etre purifie a partir de lysats et extraits cellulaires, 
du sumageant du milieu de culture, par des methodes utilisees ^ 

10 individuellement ou en combinaison, telles que le fractionnement, les 
methodes de chromatographic, les techniques d'immuno-affinit6 a 
Taide d'anticorps mono- ou polyclonaux specifiques, etc. Une variante 
preferee consiste a produire un polypeptide recombinant fusionn6 a 
une proteine « porteuse » (proteine chimere). L'avantage de ce systeme 

15 est qu'il permet une stabilisation et une diminution de la proteolyse du 
produit recombinant, une augmentation de la solubilite au cours de la 
renaturation in vitro et/ou une simplification de la purification lorsque 
le partenaire de fusion possede une afiinite pour un ligand specifique. 

La presente invention conceme Tutilisation d*un polypeptide 

20 choisi parmi un polypeptide hOBPIIa et hOBPIIb selon Finvention ou fjjj^ 
run de leur fragment^et parmi LCNl, la « retinol binding protein n (RBP) 
et Tapolipoproteine D (ApoD) comma proteine de liaison a un ligand 
hydrophobe, de preference une molecule odorante. En effet, outre les 
polypeptides OBPII mentionnes precedemment, la fonction OBP des 

25 lipocalines LCNl, RBP et ApoD n'a jamais ete suggeree. En effet, si la 
presence de LCNl dans le mucus nasal a ete decrite (Redl et al., 1992), 
c'est en fait une autre fonction qui lui a ete attribuee, a savoir une 
fonction d'anti-protease, alors que la fonction piincipale de la proteine 
LCNl semble bien etre le transport de ligands hydrophobes, d'ailleurs 

30 les essais realises dans le cadre de la presente invention avec une 
proteine LCNl recombinante n'ont pas permis de mettre en evidence 



une activite anti-protease. II en va de meme pour la « retinol- binding 
protein » et Tapolipoproteine D qui n'ont jamais ete presentees comme 
ayant une fonction OBP. 

La presente invention conceme egalement Futilisation d'un 

5 pol3rpeptide selon Tinvention ou Tun de ses fragments, LCNl, RBP et 
Tapolipoproteine D comme inhibiteur competitif, comme agoniste ou 
antagoniste des recepteurs cellulaires aux lipocalines. L'utilisation 
d'inhibiteur de liaison des lipocalines a leur recepteur peut etre utilisee 
dans une strategie anti-cancereuse ; en effet, un certain nombre de 

10 tumeurs sont hormono-dependantes : ainsi les tumeurs du sein sont 
sensibles aux steroides ; ces steroides etant transportes par les 
lipocalines, il est dans Tetendue de I'invention de foumir des 
inhibiteurs de liaison aux polypeptides selon Tinvention et LCNl, OBP 
ou APO-D pour eviter la fixation des hormones steroides au niveau des 

15 recepteurs des cellules tumorales. 

Llnvention conceme egalement un anticorps monoclonal ou 
polyclonal et ses fragments, caracterises en ce qu*ils lient 
specifiquement un polypeptide selon Tinvention. Les anticorps 
chimeriques, les anticorps humanises et les anticorps simple chaine 

20 font egalement partie de Tinvention. Les fragments d'anticorps selon 
Tinvention sont de preference des fragments Fab ou F(ab')2. 

Les pol3rpeptides selon Tinvention permettent de preparer des 
anticorps monoclonaux ou polyclonaux. Les anticorps monoclonaux 
pourront avantageusement etre prepares a partir d^ybridomes selon la 

25 technique decrite par Kohler et Milstein en 1975. Les anticorps 
polyclonaux pourront etre prepares, par exemple par inmiunisation 
d'un animal, en particulier une souris, avec un polypeptide selon 
Tinvention associe a un adjuvant de la reponse immunitaire, puis 
purification des anticorps specifiques contenus dans le serum des 

30 animaux immunises sur une colonne d'affinite sur laquelle a 
prealablement ete fixe le polypeptide ayant servi d'antigene. Les 
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anticorps polyclonaux selon rinvention peuvent aussi etxe prepares par 
purification sur una colonne d'affinite, sur laquelle a prealablement ete 
immobilise un polypeptide selon Tinvention. 

L'invention porte egalement sur un anticorps monoclonal 

5 specifique d\in polypeptide selon rinvention et capable dinhiber 
Tinteraction entre ledit polypeptide et le recepteur cellulaire sur lequel 
se lie specifiquement ledit polypeptide. Selon un autre mode de 
realisation, Tanticorps monoclonal selon rinvention est capable 
d'inhiber Tinteraction entre ledit polypeptide et ses ligands ^ 

10 hydrophobes, de preference les molecules odorantes et de maniere 
preferee les pheromones avec lesquelles ledit polypeptide sc lie. 

Les anticorps de rinvention pourront egalement etre 
marques de la meme maniere que decrit precedemment pour les 
sondes nucleiques de rinvention et de maniere preferfie avec un 

15 marquage de type enzymatique, fluorescent ou radioactif. De tels 
anticorps marques pourront etre utilises pour la detection de ces 
polypeptides dans un echantillon biologique. De preference, 
Techantillon biologique est constitue par un fluide par exemple du 
serum, du sang ou des biopsies humaines, lis constituent ainsi un 

20 moyen d'analyse de rexpression de polypeptide selon rinvention, par 
exemple par inmiunofluorescence, marquage a I'or, inmiunoconjugues 
enzymatiques. 

Plus generalement, les anticorps de rinvention peuvent etre 
avantageusement mis en oeuvre dans toute situation ou rexpression 

25 d'un polypeptide selon rinvention doit etre observee, et plus 
particulierement en immunocytochimie, en immunohistochimie ou 
dans des experiences de « western blotting », dans les techniques 
ELISA et RIA. II est ainsi dans I'etendue de rinvention de foumir une 
methode de detection et/ou de dosage d'un polypeptide selon 

30 rinvention, dans un echantillon biologique, caracterise en ce qu'il 
comprend les etapes suivantes de mise en contact de rechantillon 
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biologique avec des anticorps selon rinvention puis de mise en 
evidence du complexe antigene-anticorps forme. 

Entre egalement dans le cadre de rinvention, un necessaire 
pour la detection et/ou le dosage d'un polypeptide selon rinvention 
dans un echantillon biologique, caracterise en ce qu'il comprend les 
elements suivants : (i) un anticorps monoclonal ou polyclonal tel que 
decrit precedemment ; (ii) le cas echeant, les reactifs pour la 
constitution du milieu propice a la reaction immunologique ; (iii) les 
reactifs permettant la detection des complexes antigene-anticorps 
produits par la reaction immunologique. Ce necessaire est notamment 
utile a la realisation d'experiences de Western Blotting ct aux 
experiences d'immunoprecipitation, 

Les hOBPII selon la presente invention peuvent etre utilisees 
dans de nombreuses applications. 

Les premieres applications des OBP resident dans le controle 
des odeurs ; ces applications concement essentiellement ITiygiene 
corporelle (parfumerie, cosmetologie, pharmacie) ou collective. 

EUes peuvent etre utilisees dans un procede pour controler la 
volatilisation d'une odeur; un tel procede se caracterise en ce qu'il 
comprend une etape de liaison de ladite odeur avec un polypeptide 
selon ^invention ou avec les proteines LCNl, RBP ou Tapolipoproteine 
D. 

II est egalement possible de fixer Todeur sur un support solide 
en utilisant une OBPII selon ^invention attachee audit support, cette 
fixation pouvant etre aussi bien une fixation covalente que non 
covalente, par example par adsorption ou par des fixations de type 
avidine-biotine, si cela est necessaire. Dans ces conditions, on obtient 
un support parfume retenant les odeurs plus longtemps, liberant 
progressivement les odeurs et pouvant etre utilise aussi bien dans le 
domaine cosmetique que dans le domaine des produits d'entretiens en 
general. Les supports utilises pourront etre des supports de type 
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plaque ou de type bille par exemple. Bien entendu, Ics OBPII selon la 
presente invention seront plus particulierement utilisables dans 
rindustrie de la parfumerie et de la cosmetique ou les OBP seront 
utilisees sous forme d'un melange liquide destine a controler la 
5 volatilisation des odeurs apres que la composition ait ete repandue sur 
la peau humaine. Ceci permet de prolonger la « tenue » des parfums ou 
d'entrer dans la composition des deodorants corporels notamment. 
Bien entendu, le terme « parfum » englobe de fagon generale les 
melanges connus en parfumerie, a base d'alcool ou sous forme 

10 aqueuse, et contenant notamment des huiles essentielles. Le 
polj^eptide selon Tinvention peut egalement entrer dans la 
composition de cremes a base de retinol en tant qu 'agent de transport 
et de protection dudit retinol pour des applications cosmetologiques et 
notamment pour prevenir, effacer et traiter les rides, les ridules de la 

15 peau, lutter centre le relachement cutane et/ou sous-cutane. 

Parmi les applications concemant lliygiene collective, le 
procede selon Tinvention peut etre utilise dans un dispositif visant a 
desodoriser les locaux tels par exemple les animaleries, leis etables. Un 
tel dispositif peut egalement etre envisage pour desodorise le flux d'air 

20 entrant dans un appareil a air conditionne ; un tel dispositif serait tres 
utile dans les zones geographiques poUuees. 

L'invention conceme egalement un procede de criblage de 
molecule, de preference les odeurs ou saveurs qui comprend de passer 
la molecule sur un substrat qui comprend un polypeptide selon 

25 rinvention ou, LCNl, RBP et Tapolipoproteine D lie audit substrat, ledit 
polypeptide liant ladite odeur ou saveur et de recuperer ladite odeur ou 
saveur depuis le potypeptide si necessaire, Les OBP selon Tinvention 
pourraient ainsi permettre Tisolement dbdeurs ou de parfums en les 
fixant sur un support tel que decrit precedemment mais qui, dans ce 

30 cas, pourra etre par exemple une colonne de chromatographic, en 
faisant passer sur celle-ci le produit sur lequel on souhaite capter les 
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odeurs. II est bien entendu possible, toujours dans ce meme type 
d'kpplication, d'effectuer une analyse d'un parfum complexe en 
utilisant les differences de retention des differents produits par les 
OBP. 

5 Le procede d'isolement decrit precedemment peut egalement 

etre utilise pour separer des « odeurs » particulieres, notamment les 
pheromones humaines. 

Les hOBPII selon la presente invention peuvent etre utilisees 
pour des applications agro-alimentaires ou industrielles. 

10 Les OBP selon la presente invention de part leurs 

caracteristiques peuvent permettre de solubiliser certaines molecules 
lipophHes en les associant avec lesdits OBP. Ainsi les polypeptides 
selon rinvention peuvent etre utilises en combinaison avec des acides 
gras alimentaires a titre d'additif alimentaire. La presente invention 

15 conceme un procede pour solubiliser des molecules lipophiles 
caracterise en ce qu'il comprend la liaison de ladite molecule lipophile 
a un polypeptide selon Tinvention, a LCNl, RBP ou a TapoD. 

Les OBPII, de meme que LCNl, RBP et ApoD sont susceptibles 
d'etre impliquees dans le transport des acides gras et dans les 

20 mecanismes biologiques permettant la detection de la charge en acides 
gras de la ration alimentaire, au niveau buccal notamment. L'invention 
conceme done egalement l*utilisation des polypeptides precedents en 
association avec des acides gras pour diminuer la consommation 
d'acides gras, notamment dans les hyperlipidemies ou les obesites. Les 

25 polypeptides precedents peuvent dont etre utilises pour le traitement 
des hyperlipidemies et de I'obesite. En effet, ces proteines participent a 
la detection de la teneur en acides gras dans la prise alimentaire 
(Gilbertson, 1998), un exces de ces proteines doit conduire a leurrer le 
systeme physiologique detectant la charge en gras d'une ration 

30 alimentaire. Ainsi, une portion alimentaire pauvre en graisse mais 
supplementee en OBP ou ApoD ou RBP ou LCNl prealablement 
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chargees en acide gras, sera faussement identifide comme riche en 
graisse. 

Une autre application est de complementer un lait non 
matemel avec un ou plusieurs des pol3rpeptides decrits precedemment. 

5 Les OBP selon la presente invention peuvent etre utilisees en 

therapie preventive et curative. 

Ainsi, Tabsence de detection de ce type de proteines dans un 
prelevement biologique en utilisant un anticorps, une amorce, une 
sonde selon Invention pourrait etre un element de diagnostic ^ 

10 des anosmies. 

De meme, il est possible de prfivoir la detection des anticorps 
anti-OBPII dans un echantillon biologique d'origine humaine, la 
presence ou le dosage de ces anticorps pourrait etre en rapport avec 
certains types d'allergies, notamment chez les asthmatiques. Dans ce 

15 cas, il pourrait etre possible de traiter ce type d'alleigie par 
administration de fragments de polypeptides tels que dScrits, ce qui 
diminuerait les reactions immunitaires aux allergies extemes. 
L*invention conceme done un precede de detection d'anticorps dirigg 
centre les OBPII humaines (hOBPII) dans le serum humain de patient 

20 allergique et/ou asthmatique en utilisant un polypeptide hOBPII selon 9 
I'invention. 

Selon un autre mode de realisation, I'invention conceme un 
precede de detection d'anticorps dirige centre les OBPII humaines 
(hOBPII) dans un fluide biologique de patient atteint dHin cancer, et 

25 notamment du cancer de la prostate et/ou du cancer du sein et/ou du 
cancer de l*uterus et/ou de Tovaire et/ou du poumon. En effet, les 
proteines selon I'invention sent sur-exprimees dans les tumeurs et 
notamment dans le cancer de la prostate (US 5804368, WO 97 10503, 
CS 84 02898, CS 83 02012, CS 82 08506, CS 82 08215), le cancer du 

30 sein (Stoecz et Gould, 1995 ; Simard et cd., 1992), le cancer de I'uterus, 
le cancer de I'ovaire, le cancer du poumon. 



Les OBP selon la presente invention peuvent egalement etre 
utilisees dans des compositions pharmaceutiques, ceci notamment afin 
de vectoriser certaines drogues. 

En effet, les lipocalines sent utilisees par les mammiferes pour 

5 transporter des molecules hydrophobes au sein de Guides biologiques. 
II semble meme que ce soit les transporteurs naturels des 
xenobiotiques in vivo. Pour exemple, une surcharge experimentale en 
xenobiotiques cree chez le rat male des tumeurs au niveau du tube 
contoume proximal (TCP) du nephron (Borghoff et cd., 1990). En effet, 

10 les proteines MUP, seulement produites chez le rat male, sont 
reabsorbees par les cellules TCP ; apres degradation lysosomiale, les 
proteines MUP liberent les xenobiotiques qu'elles transportaient. Ceux- 
ci s'accumulent dans ces cellules et les conduisent vers une voie 
tumorale par mutagenese. Les lipocalines semblent done etre la 

15 structure ideale pour pieger en leur calice une molecule utilisee conmie 
medicament, evitant ainsi une distribution generale de celui-ci, Ainsi, 
G. Beste et aZ.(1999) et la demande WO 99 16873 decrivent une 
strategic de mutagenese et de criblage permettant dldentifier 
des variants d*une lipocaline ayant une afiinite optimale pour un 

20 ligand donne. II est done possible de creer une « cage a medicament » 
hautement specifique. 

La presente invention conceme done un poljrpeptide selon 
I'invention en tant qu'agent de ciblage de compose pharmaceutique. 
Par agent de ciblage, on entend designer les polypeptides de Tinvention 

25 capables d'assurer le transport et la liberation du ligand auxquels ils 
sont lies au niveau de certains tissus ou cellules cibles qui possedent a 
leur surface des recepteurs auxdits polypeptides, Ainsi, Tinvention 
conceme le transport de medicament au sein de la cage d'un 
polypeptide selon Tinvention et du ciblage de cellules grace a la 

30 capacite de TOBPII a se fixer a un recepteur specifique. 
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II est egalement dans Tetendue de rinvention de developper des 
proteines de fusion ou des proteines chimeriques comportant la cage 
correspondant aux lipocalines selon Tinvention associ6es a une 
proteine permettant un adressage cellulaire specifique generalement 

5 different de celui naturel des OBPII. La presente invention a done pour 
objet un polypeptide caracterise en ce que ledit polypeptide est exprime 
sous la forme d'une proteine de fusion avec une proteine permettant 
un adressage cellulaire specifique. Parmi les proteines permettant un 
adressage cellulaire specifique, il convient de citer les interleukines, les 

10 cytokines, les lymphokines, les chemokines, les facteurs de croissance, 
les hormones, les anticorps mono- ou polyclonal. Les interleukines, 
cytokines et lymphokines sont choisies dans un groupe compose de 
preference des interleukines 11-1 a 11-20, des interferons a-IFN, p-IFN et 
y-IFN. Les facteurs de croissance sont de preference les facteurs 

15 stimulateurs des colonies (colony stimulating factors) G-CSF, GM-CSF, 
M-CSF et Terythropoietine. Les hormones sont choisies de preference 
parmi les hormones steroidiennes, 

Selon un autre mode de realisation, le polypeptide selon 
rinvention en tant qu'agent de ciblage de compose pharmaceutique est 

20 associe a une molecule permettant un adressage cellulaire specifique, 
Parmi, les molecules permettant un adressage cellulaire sp6cifique, il 
convient de citer le groupe des steroTdes, des interleukines, des 
cytokines, des lymphokines, des interferons, des facteurs de 
croissance, des hormones, des anticorps. De preference, la molecule 

25 est un steroide. L'association entre le polypeptide selon rinvention et 
ladite molecule est realisee soit par une liaison non covalente en 
utilisant par exemple le systeme avidine-biotine ou soit par une liaison 
covalente en utilisant par exemple des agents chimiques pontants. 

Parmi les composes pharmaceutiques que pent transporter et 

30 cibler le pol3rpeptide selon I'invention, il convient de citer les 
medicaments et notamment les agents anticancereux. Les agents anti- 
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cancereux sont selectionnes parmi le groupe des agents 
antiproliferatifs, antineoplastiques ou <ytotoxiques et sont utilises pour 
arreter le d6veloppement des cancers et pour induire une regression 
et/ou une elimination de la masse tumorale. Ces agents anticancereux 

5 sont de preference des radioisotopes, et de maniere encore preferee des 
radioisotopes emetteurs de rayons gamma tels que riodei^i, 
ITttrium^, TOri^, le Palladium ^o^, le Cuivre^^^ le Bismuth^i^ et 
rAntimoine2ii. Les radioisotopes emetteurs de rayons beta et alpha 
peuvent ggalement etre utilises pour la therapie. Les agents 

10 anticancereux non isotopiques lies au polypeptide selon Tinvention 
sont multiples et varies; on peut citer: (i) les antimetabolites telles les 
agents anti-folate, le methotrexate, (ii) les analogues des purines et des 
pyrimidines (mercaptopurine, fluorouracile, 5-azacytidine), (iii) les 
antibiotiques, (iv) les lectines (ricine, abrine) et (iv) les toxines 

15 bacteriennes (toxine diphterique) ; les toxines sont choisies de 
preference parmi Texotoxine A de Pseudomonas^ la toxine diphterique, 
la toxine cholerique, la toxine anthrox de Bacillus, la toxine Pertussis, 
la toxine Shiga de Shigella, la toxine apparentee a la toxine Shiga, les 
toxines d'Escherichia coli, la colicine A, la d-endotoxine, 

20 ITiemagglutinine d 'Haemophilus A. 

L'invention conceme egalement une composition 
pharmaceutique comprenant un compose pharmaceutique lie au 
moins a un polypeptide selon Tinvention et un vehicule 
pharmaceutiquement acceptable. II est egalement dans Tetendue de 

25 llnvention d'augmenter la capacite de fixation par mutagenese de cette 
meme proteine. L'invention conceme une composition pharmaceutique 
telle que definie precedemment pour le traitement du cancer, et 
notamment le cancer de la prostate, le cancer du sein, le cancer de 
I'uterus, le cancer de Tovaire, le cancer du foie et le carcinome des 

30 cellules epitheliales pulmonaires. Etant donne que TOBP denommee 
hOBPIIb, rapolipoproteine D, la RBP et Ta-l-acide glycoproteine sont 
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exprimees dans la prostate, la composition pharmaceutique selon 
Finvention est destinee au traitement du cancer de la prostate, De 
meme, etant donne qu'il a ete demontre que TARNm des proteines 
ApoD, RBP et LCNl est produit dans la glande mammaire en plus de la 

5 production de hOBPIIb deja decrit dans la demande WO 99 07740, la 
composition pharmaceutique selon Tinvention est destinee au 
traitement du cancer du sein. 

L'invention porte aussi sur un polypeptide selon Tinvention en 
tant que transporteur de compose pharmaceutique. Par transporteur, ^ 

10 on entend designer des polypeptides selon Tinvention capable de 
vehiculer dans I'organisme un compose pharmaceutique sans que ledit 
compose ne soit libere a un endroit privilegie dans Torganisme. Un tel 
polypeptide constitue un moyen de delivrance dudit compose 
pharmaceutique dans Torganisme. 

15 La presente invention conceme egalement une composition 

pharmaceutique selon Finvention caracterise en ce que ledit 
polypeptide constitue une forme retard de delivrance dudit compose 
pharmaceutique dans Forganisme. 

En effet le compose pharmaceutique d'interet lie au polypeptide 

20 OBPII selon Finvention diffuse progressivement dans Forganisme a ^ 
mesure que ledit polypeptide transporteur est catabolise dans 
Forganisme. L'utilisation des techniques de FADN recombinant permet 
a ITiomme de Fart de modifier la duree de demi-vie du polypeptide 
OBPII dans Forganisme en introduisant des modifications dans ledit 

25 polypeptide. Ainsi, il . peut etre interessant de developper un 
polyi>eptide homologue selon Finvention pour lequel les sites de 
coupures proteasiques ont ete mutes afin d'augmenter la demi-vie 
dudit polypeptide dans Forganisme. II peut etre egalement interessant 
de developper un polypeptide multimerique, exprime par exemple sous 

30 la forme d'une proteine de fusion, afin d'eviter une « fuite 
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glomerulaire » (clearance renale) et ainsi d'augmenter la demi-vie dudit 
polypeptide dans Torganisme. 

Selon un autre aspect, Tinvention conceme un compose 
caracterise en ce qu'il est choisi parmi un anticorps, un polypeptide, 

5 un ligand, un polynucleotide, un oligonucleotide ou un vecteur selon 
invention a titre de medicament et notamment en tant que principes 
actifs de medicament ; ces composes seront preferentiellement sous 
forme soluble, associes a un vehicule pharmaceutiquement acceptable. 
Par vehicule pharmaceutiquement acceptable, on entend designer tout 

10 type de vehicule employe habituellement dans la preparation de 
compositions injectables, c'est-a-dire un diluant, un agent de 
suspension tel une solution saline isotonique ou tamponnee. De 
preference, ces composes seront administres par voie systemique, en 
particulier par voie intraveineuse, par voie intramusculaire, 

15 intradermique ou par voie orale. Leurs modes d'administration, 
posologies et formes galeniques optimaux peuvent etre determines 
selon les criteres generalement pris en compte dans Tetablissement 
d'un traitement adapte a un patient comme par exemple Tage ou le 
poids coiporel du patient, la gravite de son etat general, la tolerance au 

20 traitement et les effets secondaires constates, etc. 

L'invention conceme egalement une composition 
pharmaceutique comprenant un vecteur d'expression selon Tinvention 
et un vehicule pharmaceutiquement acceptable, 

II est egalement possible d'utiliser la propriete d'expression 

25 dans des sites particuliers de ces prot6ines afin d'assurer une imagerie 
et/ou un diagnostic de certains types de cancer. 
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D'autres caracteristiques et avantages de Tinvention 
apparaissent dans la suite de la description avec les exemples et les 
figures dont les legendes sont representees ci-apres. 
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FIGURES 



FIGURB 1 : Organisation genomique du locus LCNl/hOBPII 

La ligne du haut represente la region du chromosome 9q34, La 
5 double fleche indique Tintervalle entre la localisation des marqueurs 
polymorphes D9S1811 et D9S67 ; la position relative des marqueurs 
D9S67 et D9S1826 est incertaine. 

Le niveau du milieu indique I'organisation partielle des cosmides 
a 3 loci differents : LCNlc, LCNlb-hOBPnb, LCNl-hOBPiia- Les 
10 cosmides (approximativement 40 kb) sont representes par des lignes 
horizontales avec leur nom et les bras des vecteurs T3 ou T7 notes au- 
dessous de la ligne. Les fleches representent les differents genes ou 
pseudogenes avec leur orientation respective. Dans les cosmides, les 
lignes en pointilles verticales representent les sites EIcoRI. Le symbole 
15 ® indique une orientation incertaine du locus. 

Le niveau inferieur montre les structures intron/exon des genes 
LCNl et hOPBII : les boites noires representent les exons ; les fleches 
representent le site dlnitiation de la transcription ; oil a ol5 
representent les . sondes d'oligonucleotides utilisees pour cribler les 
20 cosmides ; Alu represente la presence de sequences repetees. 



FIGURB 2 : Analyse **Dot Plot** de : 

(A) sequence locus LCNl-hOBPIIa (AC000396+ACXXXXX) centre 
locus LCNlb-hOBPIIb (AC002098) ; 
25 (B) sequence locus LCNl-hOBPIIa (AC000396+ACXXXXX) contre 
sequence locus LCNlc ; 

(C) sequence locus LCNlb-hOPBIIb (AC002098) contre sequence 
locus LCNlc (AC002106). 

Des sequences genomiques ont ete filtrees pour les sequences 
30 repetitives a Taide de « Repeatmasker » (REF), puis comparees et 
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« dotplotted « avec le logiciel gcg en utiUsant une taille de fenetxe de 25, 
et un critere de 20 avec une homologie de 80%. 

FIGURE 3 : Sequence nncleotidique de genes hOBPII. 

Les Ugnes superieures representent la sequence hOBPIIa et les 
Ugnes inferieures la sequence hOBPIIb pour laquelle seuls les 
nucleotides differents sont representes ; un tiret indique I'absence de 
sequences correspondantes. Les capitales ombrees sont les sequences 
exoniques et les lettres minuscules les sequences introniques. Les 
tallies indiquees sur la gauche sont indiquees en pb. La boite TATA est 
en caracteres gras et le signal de polyadanylation est souligne. Les 
boites indiquent les sites accepteurs d'epissage pour les exons 5, 5b, 
5c. 



FIGURE 4 : Representation schematique des denx genes hOBPII et 
de lenx ARNm conespondants. 

Les lignes horizontales representent I'organisation exon/intron 
avec des taiUes indiqudes en pb. Les boites ombrees num6n>tees de 1 a 
7 sont les sequences exoniques codantes des principaux transcrits ; les 
lettres b et c font reference a des exons sumumeraires. Les differents 
transcrits sont representes a I'aide de bottes assemblees : les 
premieres, hOBPIIaa et hOBPIIba correspondent aux transcrits 
principaux, les autres correspondent aux formes issues d'un epissage 
altematif. 1 indique un decalage du cadre de lecture resultant de 
I'insertion ou de la delation d'un exon et * represente un codon stop. La 
lettrc « a » represente une heUce a et « b » des feuilles p predis par le 
logiciel DSC. Les lettres en italique sont des predictions obtenues avec 
le logiciel "Predator". 



FIGURE 5 : Alignement des sequences des proteines issues des 
deux genes hOPBIIa et hOBPIIb humains (hOBPUaa = 
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OBP2aaHOMS, hOBPIIba = OPB2baHOMSA, hOBPIIbp = 
OPB2bbHOMSA, hOBPHay = OBP2agHOMSA, liOBPHap = 
OBP2abHOMSA), des Upocalines des larmes htimaines 
(LCNl.HOMSA), d'OBPII de rat (OBP2_RATNO), de lactoglobulme 
bovine BLG (LACB_BOSTA), de MUP de souris (MUP6_lttUSanj), de 
RBP humaine (RBP_HOMSA), d'OBP bovine (OBP_BOSTA), de BIUP 
de rat (MUP_RATNO), d'OBP porcine (OPB.SUSSC). 

Les residus dans les boites gris fonce sont identiques et ceux 
dans les boites gris claires sont simUaires. Les Elements de structure 
secondaire predits avec le programme DSC sont soulignes et les 
rSsidus d'amino-addes sont en italiques. Us feuiUets p et les helices a 
sont numerot6es pour hOPBIla et b. Le site de clivage prevu du peptide 
signal est indique par une fleche (AAAiLS) en position 15. Des 
sequences non alignees de formes tres diveigentes de genes 6piss6s, 
hOPBaS (OPB2adHOMSA) et hOBPbyr (OBP2bgHOMSA) ont etc ajoutees 
au bas de I'alignement apr^s I'analyse. 



FIGURE 6 : Analyse RT-PCR 

(A) Detection des produits RT-PCR LCNl, LCNlb, LCNlc avec 
leurs sondes specifiques, et (B) Detection des produits RT-PCR 
hOBPIIa et hOBPIIb avec leurs sondes specifiques. (C) ARN G3PDH 
contFole. Les tailles sont indiquees en pb. 



FIGURE 7 : Localisation tissulaire des ARNm hOBP 

Des sections du meat moyen (A,B), des comets (C,D), de la 
prostate (E,F), des canaux deferents (G,H), des glandes mammaires (I, 
J) ont ete hybridees a des ribosondes de hOBP marquees a la 
digoxigenine-ll-UTP. L'hybridation avec une ribosonde hOBP sens n'a 
pas revele de signal (B,D,F,H, J). Un signal d'hybridation specmque est 
obtenu avec une ribosonde antisens (A,C,E,G, I). Les fleches indiquent 
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des structures differentes : AC : cellules acineuses, EC : cellules 
epitheliales, GC : cellules glandulaires, SD : canal secretoire et L : 
lumen (X200). 



FIGURB 8 : Arbre de distance phylogenetique des lipocalines des 
vertebres. 

Les abreviations usuelles des lipocalines ont ete employees. Apres le 
symbole 'L" sont indiquees les trois premieres lettres du genre suivies 
10 des deux premieres lettres de Tespece. 



FIGURE 9 : Schema de I'evolution de la sous-famxlle de gene LCNl- 
OBPII au cours de 1' evolution. 

15 Les boites indiquent les exons disposes sur une ligne representant 
TADN genomique. Les « // » entre les lignes indiquent que les loci ne 
sont pas consecutifs, sans qu*il soit possible de determiner Tordre. La 
large croix sous le symbole « ? » illustre un evenement de duplication 
partielle ou de complete duplication avec une deletion genomique 

20 ulterieure pour le locus LCNlc (choix indique par le symbole « * La 
croix plus petite indique Telimination du septieme exon qui semble etre 
specifique de ITiomme a cause des nombreuses sequences repetees Alu 
presentent dans cette region genomique et parce que le rat a deux 
genes VEGP. Le symbole « ** » marque Tetape de recrutement d'exons 

25 basee sur les donnees presentes et celles de la litterature ; cette etape 
a pu apparaitre a n'importe qu'elle moment apres les duplications des 
loci et a pu etre sequentielle. 
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FIGURE lO : Analyse par RT-PCR dans la sphere orale et la sphere 
genitale de Fexpression des autres lipocalines faumaines connues. 
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Definition de nouvelles fonctions OBP et VEGP pour les proteines RBP 
(retinol-binding-protein) et ApoD (apoliporoteine D). 



S FIGURE 11 : Etude de Tanticorps polyclonal dirige contre les 
proteines hOBPII. 

La proteine de fusion est deposee dans les puits 1 et 3, Un echantillon 
de mucus nasal humain est depose dans les puits 2 et 4. Les proteines 
contenues dans les puits 1 et 2 ont ete revelees par coloration au bleu ^ 
10 de Coomassie. L'anticorps hybride sur la membrane obtenue par 
Western-blotting revele specifiquement la proteine GST-hOBPIIb entre 
30 et 42 kDa (puit 3) et les hOBPIIa et hOBPIIb (puit 4) de 18 kDa 
dans le mucus nasal humain. 
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FIGURE 12 : Immunohistochimie sur les tissus de Tappareil 
olfactif. 

Une forte immunoreactivite est reperable sur la coupe de septum 
(coloration verte. A) sur les deux coupes de comet (C et D) et sur la 
20 coupe de meat moyen (F). Les temoins negatifs realises pour le septum 
(B) et pour le comet (E) et pour le meat moyen (G) ne montrent aucune 
reactivite. Les noyaux des cellules sont reperes par une coloration au 
DAPI (coloration bleue). Les grossissements utilises sont de X 100 pour 
les coupes A, B, C, E et G et de X 200 pour les coupes D et F. 

25 

FIGURE 13 : Lmmnnohistochimie sur tissus de la sphere orale 

Ces deux tissus, glandes laciymales (A, B) et glandes de Von 
Ebner (E, F) montrent une forte immunoreactivite en comparaison des 
30 resultats obtenus grace au serum pre-immun (C pour les glandes 
laciymales et D pour les glandes de Von Ebner). Grossissement X200. 
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FIGURE 14 : Immtmohistochixnie stir les glandes mammaires et 
poumon 

Une forte immunoreactivite est visible sur les coupes de glandes 
mammaires (A et B) compare au temoin negatif ( C ) realise grace au 
serum-pre immun, Une forte immunoreactivite est egalement observee 
sur les coupes de poumon (E et F) comparee toujours au temoin 
negatif (D). chaque observation est faite a un grossissement X 100 
pour A et C et a un grossissement X 200 pour B, D, E et F. 
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EXEMPLES 
Exemple 1 : Materiels et M^thodes 

I.A. Banque de cosmides dn *»liyr> mosome 9 hmnain 

Une copie de la banque de cosmides specifiques du chromosome 
9 humain LL09NC01P construite par le Dr. J. Allmeman (Biochemical 
Sciences Division, Lawrence Livermore National Laboratory, Livermore, 
CA USA) sous r^gide du National Gene Library Project supporte 
financierement par le departcment americain de I'Energie a ete utilisee. 
Le criblage de la banque et I'analyse des clones ont €t€ realises tel que 
decrit precedemment (Lacazette et cd., 1997). 

l.B. Clonage et analyse de sequence 

Une banque Lambda gtll d'ADNc de testicules humains 
(Clontech) (lO^ p.f.u.) a ete amplifiee par 30 cycles de polymerisation 
en chaine (PGR) (94''C 45 sec, 54 "C 45 sec, 72»G Imin 30 sec) avec 
I'amorce oHEST58 GGTGCAGGTAGATGAGGTTCG et des amplimeres 5* 
ou 3' de criblage deserts situes sur les bras du vecteurs Lambda gtll. 
Une PGR nichee a ensuite ete realisee avec oliEST26 
CGCTGTATTTGCCAGGCTCG et des oligonucleotides sp6cifiques du 
bras du vecteur, Les produits PGR ont ete sous-clones dans le vecteur 
pGEM-T(r), ce qui a permis d'obtenir rextremite 5' des ADNc du gene 
hOBPII. 

Les sequences obtenues en utilisant I'oligonucleotide standard 
pGEM-T (r) et en utilisant un mixe reactionnel prfit a Temploi de 
sequengage a base de colorant terminateur {Applied Biosystems) ont 
ete separees par electrophorese en utilisant un sequengeur 
automatique ABI PRISM 377 (Perkin Elmer) puis ont ete analysees avec 
le logiciel Sequence Navigator 1.0.1. (Perkin Ebner). Des clones d'ADNc 
pleine longueur de hOBPlIa (hOBPIIa a, hOBPIla p, hOBPIIa 6, 
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hOBPIIa y) et hOBPIIb (hOBPIIb a, hOBPIIb p, hOBPIIb y) ont ete 
obtenus a partir de la RT-PCR par purification des bandes d'interet 
selon les instructions du fabricant (gel extraction kit de Qiagen) ou en 
sous-clonant dans un vecteur pGEM-T(r) les produits de la PCR nichee 
pour les formes alternatives faiblement exprim6es. 



IC. Analyse par RT-PCR 

DCS echantillons de tissus ont ete collectes chez des individus 
Caucasians agts de 45 a 55 ans en accord avec la reglementation 
10 frangaise en vigueur. UARN total est extrait selon une methode en une 
seule etape utilisant le reactif ARN NOW* selon les instructions du 
fabricant (Biogentex). 5 ^lg d'ARN total ont ete retro-transcrits dans un 
volume final de 20 nl en utilisant 0,5 ng d'oligonucleotide 
GACTCGAGTCGACATCGATTTTTTTTTTTTTT^ avec le systeme de 
15 preamplification Superscript® (Gibco BRL). Trois jil de ces reactions 
sont ensuite utilises pour les PCR suivantes. L'expression des ARNm 
specifiques a ete d6terminee par PCR en utiUsant : les amorces TL : 
CCTCTCCCAGCCCCAGCAAG et AP : GACTCGAGTCGACATCG pour les 
genes de type LCNl (LCNl, LCNlb, LCNlc) et pour les gSnes de type 
hOBPII, les amorces DE : CGCCCAGTGACCTGCCGAGGTC, et FI : 
CTTTATTTGGAGTCAGGTGGGTG. Comme controle de quality des ARN, 
les amorces G3PDH1 : CTCTGCCCCCTCTGCTGATG et G3PDH2 : 
CCTGCTTCACCACCTTCTTG du gene G3PDH ont ete utilisees ; le gene 
G3PDH est considere comme etant constitutivement exprime dans tous 
25 les types ceUulaires. 32 cycles de PCR (94° C 45 sec, 54° C 45 sec, 
72° C 2 min. 30 sec) ont 6te reaHses et les produits d'amplification 
ont et€ s€pares sur gel d'agarose a 1%. L'ADN est transfere sur une 
membrane Hybond N+®. 

Pour la detection de l'expression des differents genes, plusieurs 
30 oUgonucleotides specifiques des genes respectifs ont ete synthetises : 
-olLCNl: GACTCAGACTCCGGAGATGA, 



20 
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- olLCNlb : AACTCAGACACCAGAGATGA, 

- olLCNlc : GACTCAGATCCCGGAGATGA, 

- ol5 : CCAGGAGGGACCACTACA specifique du gene hOBPIIb, 

- ol4 : CCGGGACGGACGACTACG specifique du gene hOBPIIa, 

- G3PDH3 : CTCATGACCACAGTCCATGC, 

Les oligonucleotides sont marques au yasp.yvTP en utilisant de la T4 
kinase (AppUed Biosystem) ; les hybridations des oUgonucleotides 
marques sont realisees k 42" C. Le lavage final est realise dans une 
solution de 0,1 X SSC, 0,1% SDS a 48» C pendant 20 min. La m 
specifidte des reactions d'hybridation des oUgonucleotides est 
controlee en utiUsant des dchantillons d'ADN cosmidique digere 
(p233G2 pour LCNl et hOBPIIa, P19E7 pour LCNlb et hOBPIIb, 
P181A9 pour LCNlc) et charges sur le gel avec des produits de RT- 
PCR. 

I'D. Genotvpage et analyse de liaison 

Le genotypage est reaUse par des reactions PGR en utilisant 100 
ng d'ADN genomique provenant de 8 families de reference du CEPH et 
UtiUsant les oUgonucleotides oU9 TGTTCGGGAACGCAGCTT et oUlObis 
TGCCGCTGTCCCCACGTCGG. Les pararndtres du thermocycleur % 
consistent en un <ycle initial a 94° C pendant 10 min suivi par 30 
cycles a 94» C pendant 30 s, 55° C pendant 30 s et 70" C pendant 45 s 
puis en une etape d'elongation finale de 10 min a 70° C. Les produits 
PGR sont ensuite analyses sur un gel d'agarose a 3%. Les informations 
concemant les marqueurs du chromosome 9 peuvent etre obtenues a 
I'adresse Internet suivante (hTTP://galton.ucl.ac.uk) ; les analyses ont ete 
realisees en utiUsant les outils d'etudes de Uaison prealablement 
decrites dans Lacazette et al. (1997). Les haplotypes sont reconstruits 
manueUement selon les evdnements de recombinaison prealablement 
ddcrits dans la famiUe 1362 (Attwood et al., 1994). 
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I.E. Predictions de stmctores secondaires 

Un alignement multiple des proteines lipocalines pour lesquelles 
les structures cristallographiques ont d6ja €t€ decarites (Monaco et aL, 
1992 ; Spinelli et al., 1998) avec les proteines hOBPIIa et hOBPIIb a et6 
obtenu en utilisant le logiciel Clustalx (ftp.infobiogen.fr). Les structures 
secondaires putatives ont ete determinees avec le programme DSC 
(Discrimination of protein Secondary structure Class) developpe par 
R.D. King et M.J.E. Sternberg (http:/^ioweb.pasteu^.fr/seqanal/inte^faces/dsc- 
simplchtml). Les structures secondaires des proteines correspondantes 
aux formes altemativement episs6es sont supposees identiques aux 
formes traditionnelles avant le decalage du cadre de lecture; apres ce 
decalage la prediction de structure est e£fectu6e avec une seule 
sequence et est realisee en utUisant le logiciel Predator 
(http://pbil.ibcp. fr/cgi-bin) . 

l.F. L'aaalvse phvlogenetique 

Les proteines lipocalines dont les sequences sont connues dans 
leur totalite ont ete alignees trois fois consecutivement en utilisant le 
logiciel Clustalx (ftp://ftp.infoibiogen.fr). Des distances dans I'arbre 
phylogen6tique ont ete calculees avec Clustalx et dessinees avec 
Njplot. 

l.G. Hybridation in situ 

Des coupes seriees realisees au ciyostat (8 um d'epaisseur) sont 
coUectees sur des lames SuperFrost® Plus (Menzel Glazer) et stockees a 
- 80° C. Des sondes ARN antisens et sens sont obtenues selon les 
techniques standard en utilisant la T7 ou la SP6 polymerase a partir 
d'une matrice obtenue par digestion avec des enzymes de restriction 
Ncol ou PstI du clone cDNA de phOBPIIaP2 et en utilisant du DIG- 11- 
UTP (Boehringer Mannheim) (la longueur de la sonde est 
approximativement de 150 nucleotides). Les matrices digerees par PstI 
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et transcrites par TARN polymerase de T7 correspondent a. la sonde 
antisens et les matrices digerees par Ncol transcrites par TARN 
polymerase SP6 correspondent a la sonde sens. Des sections de tissus 
sont fixees dans du paraformaldehyde 4% pendant 15 min puis rincees 
5 pendant 5 min dans du PBS 2X. Apres acetylation (2x5 min dans un 
tampon de triethanolamine (TEA) pH 8, contenant 0,25% v/v 
d'anhydride acetique), les sections tissulaires sont pr6hybridees k 60° 
C pendant 15 min dans de la formamide 50%/ IX SSC. Les sondes 
marquees sont appliquees sur chacune des sections dans 50 nl de ^ 

10 tampon d'hybridation (50% formamide, IX Denhardt's, 500 ng/ml total 
d'ARNt, 10% de Dextran sulfate, 10 mM de dithiotr6itol). Les sections 
sont recouvertes puis incubees dans des chambres humides a 50° C 
pendant la nuit. Apres hybridation, les lames sont immergees a 55° C 
dans un tampon de lavage (50% formamide, IX SSC) pendant 2 

15 heures. Chaque lame est ensuite rincee 2 fois 5 min dans du 2X SSC a 
temperature ambiante, puis traitee pendant 30 min avec 10 mg/ml de 
RNase a 37° C, et enfin inmiergee 2 heures a 55° C dans une solution 
de lavage (50% formamide, 2X SSC). Les lames sont ensuite placees 
pendant 15 min a 55° C dans du 0,1 X SSC. La detection 

20 immunologique est realisee en utilisant un anticorps anti-DIG ^ 
conjugue a la phosphatase alkaline (fragments Fab) selon le protocole 
de Boehringer Mannheim. Les sections sont examinees a des 
grossissements dififerents utilisant un microscope Axiophot (Zeiss). 

25 l.H. Obtention d*nn anticorps polyclonal dirig6 contre les 

prot^ines hOBPn 

Deux cent cinquante m1 de proteines de fusion ont ete foumis 
la societe Agro-Bio pour la production d'anticorps. Des lapins (New 
Zealand White SPF) sont injectes aux jours 0, 14, 28 et 42. Les serums 
30 sont preleves aux jours 0, 35, 49 et 63. Afin de tester I'anticorps, la 
proteine de fusion est deposee dans les pistes 1 et 3 (Figure 11), alors 
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que du mucus nasal humain est depose dans les pistes 2 et 4. Les 
pistes 1 et 2 ainsi que la piste correspondant a I'echelle de poids 
moleculaire, correspondent a une revelation par le bleu de Coomassie. 
Les pistes 3 et 4 correspondent a une detection des proteines 
reconnues par I'anticorps a I'aide de la technique de Western blot. Les 
pistes 1 et 3 montrent la presence d'une serie de proteines 
recombinantes tronquees entre 30 et 42 kDa issues d'une synthese 
peu efficace due a la presence de nombreux codons rares chez la 
bacterie au sein de la sequence de hOBPIIb. Toutefois cette production 
de proteine recombinante fut suffisante pour produire un anticorps 
polyclonal de bonne qualite comme indique par la revelation dans la 
piste 4 correspondant au mucus nasal, d'une bande de 18 kDa 
specifique des prot6ines hOBfti. 

l.I. immnnohistochimie 

Des coupes seriees de 8 nm de differents tissus sont fixees au 
para-formaldehyde (5min), et rincees trois fois au PBS xl (15 min) 
puis incubees 30 min dans une solution 3% de BSA en PBSxl, avant 
d'€tre incub6es durant la nuit en presence de I'anticorps anti-prot6ine 
de fusion en solution PBSxl. Apres trois ringage en PBSxl (15 min), 
un anticorps anti-IgG de lapin couple au FITC (coloration verte en 
fluorescence) en solution de PBSxl est place 3 heures au contact des 
lames. Apres un ringage en PBSxl, une solution de DAPI (100 ng / nl 
en PBSxl) est appliquee pendant 10 min (centre coloration des noyaux 
cellulaires en bleu). Apres trois ringages en PBSxl (15 min), les lames 
sont montees dans de I'eau glycerinee (50/50). L'analyse est realisee en 
presence de filtres DAPI et FITC ^ I'aide d'une camera CDD en utUisant 
un temps d'integration entre 4 et 32 ms. 



Exemple 2 : Identification d'uu gene homologue a LCNl localise 
sur le chromosome 9 hnmain 

^identification de I'ADN complementaire de LCNl codant pour la 
lipocaline des larmes humaines (Lassagne et Gachon, 1993) a 
5 pr6alablement ete rapportee, ainsi que la localisation du gene sur le 
chromosome 9q34 (Lassagne et al, 1993 ; Lacazette et al, 1997). Les 
deux genes codant pour les proteines des glandes de von Ebner 1 et 2 
(Kock et al, 1994) correspondent aux proteines homologues de LCNl 
Chez le rat ; ceci pose la question de savoir s'il existe d'autres g6nes ^ 

10 codant pour une proteine LCNl dans le genome humain. Les 
experiences d'hybridation in situ (Lassagne et al, 1993) ainsi que les 
analyses avec des hybrides somatiques (Lassagne et al, 1995) 
indiquent que, s'ils existent, ces genes humains additionnels doivent 
se trouver localises dans la region chromosomique 9q34. 

15 Une banque de cosmides specifiques du chromosome 9 humain 

(LL09NP01) a ete criblee avec la sonde d'ADNc LCNl humaine ; 26 
cosmides ont ete identifies ; ceux-ci ont ete diger^s par EcoRI ou PvuII, 
puis hybrides successivement avec I'ADN de LCNl et difKrents 
oligonucleotides (figure 1). 

20 Les cosmides sont divises en 3 groupes. Le premier groupe (clones ^ 

P32H3, P41B5, P63B6, P92H20, P109C6, P145H6, P195B4, P233G2, 
P233F2, P265D4, et P276H8) correspond aux cosmides contenant une 
sequence du gene LCNl prealablement isole (numero d'accession : 
L14927) forme par 7 exons (Holzfeind et Redl, 1994). Le second groupe 

25 (clone P19E4, P19E7, P42H9, P98H5 et P142H8) correspond d la 
sequence LCNlb homologue a LCNl (clone P19E4) (num6ro 
d'accession : Y 10826) depuis le promoteur jusqu'au 6*™« exon puis qui 
diverge ensuite. Un troisieme groupe de cosmides (clone PI IOC 1, 
P174E4, P174E5, P181A9, P181B6, P211A7, P238C6 et P291E1) 

30 contient une region LCNlc, etabli a partir du sequengage partiel du 
clone P181A9 (numero d'accession Y 10827), qui est fortement 
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homogue k LCNl seulement a partir du promoteur jusqu'a I'exon 2. 
Ainsi, LCNl est le seul gene qui possede le 7^- et dernier exon. De 
plus, les boites TATA sont degenerees dans les promoteurs des genes 
LCNlb et LCNlc. 



Bxemple 3 : Identification de dupUcations genomiques contenant 
les genes de Upocalines et cartographie de la region 
cbromosoniiqae 9q34 

10 Au cours de la periode d'identification de la famille de gene LCNl, 
un vaste projet de cartographic physique a conduit k Hdentification de 
contigs de cosmides couvi^int partiellement la region chromosomique 
9q34 (Nahmias et al, 1994, Van Slegtenhorst et al., 1995, Homigold et 
cd, 1997) ; le sequen?age des clones correspondants a etc realise par 
15 un groupe du Massachusset Institute of Technology (Boston, USA). 

Des analyses de comparaison de sequences dans les banques de 
donnees de LCNl, LCNlb et LCNlc ont revele des homologies fortes 
entre le gene LCNl prealablement decrit (numfero d'accession L14927) 
et les trois sequences cosmides : P161A1 ayant le numero d'accession 
20 AC002098, P203H12 avec le numero d'accession AC000396 et P161G2 
avec le numdro d'accession AC002106. 

Une analyse tres fine notamment de la region 3' des genes LCNl a 
revele que la sequence LCNlc correspondait au clone ayant le numero 
d'accession AC002106, LCNlb au numero AC002098 et LCNl au 
25 numero AC000396 ; il existe cependant une insertion de 60 paires de 
base a la position 12360 du clone ayant le numero d'accession 
AC000396 par rapport a celui ayant le numero L14927. Des analyses 
compiementaires ont revele que ces sequences sont homologues sur 
une region beaucoup plus large que les gdnes LCNl. Comme illustre 
30 par les analyses en dot plot (figure 2), ces trois cosmides correspondent 
a des regions genomiques dupliquees ; les cosmides P161A1 
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(AC002098) et P203H12 (AC000396) sont homologues sur la totalis de 
leurs sequences ; le cosmide P161G2 (AC002106) n'est homologuc a la 
sequence uniquement pour des sequences situes en amont de I'intron 
3 du g€ne LCNl. 

Les positions relatives de ces regions dupliquees du chromosome 
9 humain ont ete analysees. Les resultats ont €te compares avec la 
carte physique etablie dans le cadre du projet de cartographic 
physique par des analyses de restriction des cosmides (Homigold et al, 
1997) en utilisant la meme banque LLN09NC01P. Approximativement 
les memes cosmides ont ete trouves dans les deux recherches pour le 
locus LCNlc ; la comparaison de sequence du cosmide P181A9 revele 
que son extremite T3 contient le gene Surf 5 (figure 1). De plus, 
AC002106 est localise dans un contig de sequence entre ABO et le 
locus Surfeit confirmant la localisation de LCNlc. P161A1 et P203H12 
ont des localisations moms precises en utilisant les donnees de 
Homigold et de ses coUaborateurs a cause de la limite de la strategic 
de cartographic de restriction pour les regions dupliquees. P203H12 
(AC000396) semble correspondre au gene LCNl qui a ete 
prealablement localise pres du marqueur D9S1826 (Lacazette et al 
1997) a I'exception d'une insertion de 60 paires de bases. 

Pour tester si P203H12 peut correspondre a une 4*»e r^on 
dupliquee, la region a ete testee par PCR sur de I'ADN gdnomique de 
150 individus non apparentes en utiUsant des amorces spScifiques 
pour AC000396 et L14927. Une bande unique correspondant a la 
longueur de la sequence AC000396 a ete detectee (donnee non 
montr6e) prouvant ainsi que P203H12 contient le gene LCNl 
prealablement decrit. Le locus LCNlb n'a pas ete positionne 
precisement dans la region comme H est demontre par le fait que les 
extremites AC002098 ainsi que les extremites des cosmides contenant 
LCNlb ne detectent aucune sequence homologue dans les banques de 
donnees. 
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L'analyse des sequences a permis d'identifier, un mini-satellite 
putatif a la position 3 177-3724 du cosmide correspondant a AC002098 
(Figure 1) ; un polymorphisme rare a ainsi ete mis en evidence dans 
une population de 20 individus non apparentes (PIC = 0,05). Ce 
nouveau marqueur polymorphe n'est informatif que dans la seule 
famiUe 1362 sur les 8 families de reference du CEPH testees. 

L'analyse de liaison a revele des lod-scores a deux points 
superieurs a 3 a teta = 0 pour les marqueurs D9S275 et D9S1818. La 
reconstruction de I'haplotype a confirme la locaHsation du gene LCNlb 
entre les marqueurs D9S1811 et D9S67 dans le chromosome 9q34 
(Figure 1). 

Exemple 4 : Identification de deux nouveaux genes de Upocaline 

Les analyses de sequences ont revele des donnees nouvelles. 
La comparaison de AC002098 a la banque de donnees a revfele 
des similarites entre cette sequence et les genes de lipocalines. En plus 
de la region 21000 a 27000 qui contient le gene LCNlb, la region 
autour de la position de 2150 contient des sequences presentant des 
similitudes avec les sequences codant pour les proteines de liaison aux 
odeurs de rat de type II, des Upocalines des larmes ainsi que pour 
TEST AA460385. 

Parallelement, la comparaison de la sequence AC000396 a la 
banque de donnees a revele en plus de la region 11100 a 17100 
contenant le gene LCNl, des similitudes pour le meme groupe de 
sequences dans la region 36600 a 37800. 

L'EST AA460385 exprimee dans les testicules humains 
correspond a 4 exons du nouveau gene de lipocaline present dans le 
clone P161A1 (AC002098). Un exon putatif de 50 paires de bases 
similaire a la sequence EST est egalement present a I'extremite du 
clone P203H12 (AC000396). 
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Les inventeurs ont done conclu a I'existence d'un nouveau gene 
de lipocaline k une position distale de LCNlb. Les inventeurs ont emis 
I'hypothese, que suite a une duplication genomique, un second gene 
orthologue au gene codant pour TEST est present dans la region 3' de 
LCNl. 

Le sequengage du cosmide P233G2 contenant cette region 
(Figure 1) avec des oligonucleotides definis a partir dT^ST a en effet 
revele la presence d'un autre gene de lipocaline a un locus distant de 
20 kb distal du gene de LCNl. Pour identifier les premiers exons des 
deux nouveaux genes, des PCR nich6es sur des clones cDNA provenant 
d'une banque de testicules ont ete realisees entre les oligonucleotides 
locaUses dans la region 5* de TEST et les bras du vecteur. Les produits 
PCR sont clones et leur sequence a r6vel6 trois exons additionnels 
d'apres la sequence genomique (Figure 1), Une bolte TATA est presente 
en amont du premier exon dans les deux cas (Figure 3). Les deux 
ARNm, hOBPIIa correspondant au gene localise en aval de LCNl et 
hOBPIIb localise en aval de LCNlb (Figures 3 et 4), sont identiques a 
97,5% et 63 % d ceux correspondant au gene LCNl. Les organisations 
intron/exon de ces deux genes sont consistantes avec la famille des 
lipocalines. 

De plus, les sequences prot6iques deduites (170 amino acides) 
confirment I'appartenance a la famille des lipocalines. Les deux 
proteines matures putatives hOBPIIa (MW = 17,8 kDa) et hOBPIIb (MW 
= 18,0 kDa) sont identiques a 89%. Ces deux nouvelles proteines 
possedent un peptide signal putatif de 15 amino acides (Figure 5), les 
residus conserves GXWY a la position 27 a 30 et deux cysteines 
susceptibles d'etre impliquees dans un pont disulfure (position 74 a 
166). 

Cependant, les comparaisons de sequences par paire avec les 
autres lipocalines indiquent une faible conservation des residus acides 
amines (15 a 25%) a I'exception de TL/VEG humain code par le gene 
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LCNl (valeur moyenne 43 % sur 155 amonoacides) et I'OBPII de rat 
(valeur moyenne 45,5 %). Par ailleurs, les points isoelectriques calcules 
de hOBPIIa et de hOBPIIb sont respectivement de 7,85 et de 8,72 alors 
que ceux des lipocalines sont acides (aux environs de 4,5) a I'exception 
de I'OBPII de rat (PI = 9,01). La prediction des structures secondaires 
des proteines hOBPIIa et hOBPIIb avec le logiciel DSC en effectuant 
des alignements multiples avec les sequences de lipocalines de 
structures connues indique la presence de 8 brins de feuiUets P 
antiparalleles pouvant permettre la formation d'un calice suivi par une 
helice a et un feuillet p final en accord avec les donnees connues des 
structures des lipocalines (Figure 5). 

Exemple 5 : Etude de Texpression des g&nes de lipocalines 
identifies 

Pour preciser si LCNlb, LCNlc, hOBPIIa et hOBPIIb sont des 
gdnes exprimes, des analyses de RT-PCR ont ete reaUsees sur 18 tissus 
humains differents connus pour produire des lipocalines (Figure 6). 

Deux couples d'amorces ont ete synthatises ; I'un reconnaJt les 
ARNm de type LCNl et I'autre les ARNm de type hOBPII. LTiybridation 
des oligonucleotides specifiques des genes sur des membranes sur 
lesquelles sont immobilises les produits de RT-PCR aprfes transfert par 
la technique de Southern, puis le sous-clonage des produits hybrides 
ont reveles que LCNlb et LCNlc ne sont exprimes dans aucun des 
produits testes, alors que les ARNm de LCNl sont detectes dans la 
^lande lacrymale, les glandes sudoripares, les glandes de von Ebner, le 
septum nasal, I'epithelium du comet nasal , tout comme le placenta et 
les glandes mammaires (Figure 6A). Ces donnees et les informations de 
sequences qui indiquent que la boite TATA et le dernier exon ont ete 
perdus permettent d'affirmer que LCNlb et LCNlc sont des 
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pseudogenes qui ne participent pas a la formation des proteines LCNl 
humaines. 

A I'inverse, les genes hOBPIIa et hOBPIIb sont exprimes, ce qui 
confirme leur detection precedente dans les banques d*ADNc. De 
5 maniere surprenante, bien que les deux proteines hOBPIIa et hOBPIIb 
soient tr6s similaires sur la totalite de leur sequence y compris dans la 
F^on promotrice de 1,5 kb, leur profil d'expression sont differents 
(Figure 6B). La proteine hOBPIIa est fortement exprim^e dans le 
septum nasal, le meat moyen, le comet nasal, les testicules et le ^ 
10 placenta et plus faiblement dans les glandes mammaires, les glandes 
laciymales, les glandes sudoripares, les glandes de von Ebner et le 
poumon. A I'inverse, la proteine hOBPIIb est exprimee de maniere 
predominante dans la prostate, les testicules et les glandes 
mammaires et plus faiblement dans les glandes sous-maxiUaires, le 
15 septum nasal et le meat moyen. 

De plus, les analyses de RT-PCR ont revele I'existence d*uxi 
6pissage altematif du produit de transcription du gene hOBPIIa et du 
gene hOBPIIb qui genere respectivement quatre et trois ARNm (Figures 
3, 4, Set 6). 

20 La transcription du gene hOBPIIa genere au moins quatre ^ 

ARNm qui codent pour quatre prot6ines differentes; le premier ARNm 
code pour la protfiine hOBPIIaa qui correspond 4 la proteine hOBPIIa 
decrite precedemment. Dans le gene hOBPIIa, trois sites accepteur 
d'epissage differents ont ete identifies pour I'exon 5 (figure 3 et 

25 4) formant ainsi deux autres variants d'epissage. Un premier variant 
d'epissage presente un site accepteur pour I'exon 5 localise 49 pb 
avant le precedent (exon 5b) ; ceci genere un ARNm de 725 nucleotides 
qui code pour la proteine hOBPIIaP de 146 aminoacides. Cette proteine 
est identique jusqu'au 8*°** feuillet p putatif puis differente ensuite avec 

30 seulement 16 aminoacides additionnels. Un second variant d'epissage 
presente un site accepteur pour I'exon 5 localise 65 pb avant le 
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precedent (exon 5c) ; ceci genere un ARNm de 74 1 nucleotides qui code 
pour une proteine hOBPIIay de 228 aminoacides. Cette 
proteine possede les huit premiers feuiUets p putatifs identiques a ceux 
de hOBPIIaa puis est differente dans la r6gion C-terminale (figure 5) a 
5 cause d*un decalage de cadre de lecture genere par cet evenement 
d'epissage altematif ; la structure de cette region C-terminale preditc 
par le logiciel Predator est une longue region coudde contenant une 
9«mc feuillet p. 

Dans le cas du gene hOBPIIb, en plus de TARNm hOBPIIba 
10 prealablement decrit, un exon sumumeraire de 106 . pb (exon 3b) entre 
les precedents exons 3 et 4 a et6 identifie (figure 3). Cet ARNm plus 
long (782 nucleotides) code pour une proteine hOBPIIbp de 165 amino- 
acides. Du point de vue de la structure proteique, hOBPIIbP est 
identique a hOBPIlba jusqu'au 5^°^« feuillet p putatif puis differe 
15 ensuite a cause dMn decalage du cadre de lecture. Les predictions des 
logiciels informatiques indiquent que le motif ALWEALAIDTRLK est 
une h€lice a qui est juste derriere le cinquieme feuillet p. Deux feuillets 
p additionnels peuvent etre presents dans la longue partie C-terminale. 

Aucun des variants d'epissage altematifs pour un gene n'est 
detecte symetriquement pour I'autre gene bien que les sites d'epissage 
accepteur et donneur putatifs puissent etre presents (figure 3). En plus 
de ces motifs proteiques qui conservent ia structure traditionnelle 
d\ine lipocaline, nous avons demontre, pour les deux genes hOBPlIa et 
hOBPIIb, I'existence d\ine faible quantite d'ARNm ayant subi un 
25 epissage altematif et codant pour des proteines dont la sequence n'est 
pas directement U6e aux Upocalines. Des ARNm codant pour hOBPIIaS 
et hOBPIlby auxquels ils manquent la sequence codant pour I'exon 2 et 
qui possedent respectivement I'exon 5b et I'exon 5 codent pour des 
proteines putatives secretees de 147 et de 85 amino-acides 
respectivement (figures 4 et 5) ; ces proteines divergent des proteines 
precedentes a partir du 24«"»« amino-acide. 
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Pour identifier les cellules exprimant les genes hOBPII, les 
inventeurs ont hybride des sondes ribonucleiques sens et anti-sens 
marquees a la digoscygenine sur des sections tissulaires (figure 7). Les 
ARNm hOBPII sent detectes dans les cellules acineuses du meat 
moyen et des comets nasaux ainsi que des cellules epitheliales des 
comets ; ceci soutient I'idee que les proteines hOBPII sont impliquees 
dans la fonction olfactive. En plus de la production dans la sphere 
orale, des ARNm codant pour hOBPII ont ete detectes dans la sphere 
genitale, notamment dans les cellules glandulaires de la prostate, dans 
les cellules secretrices epitheUales du canal deferent. Aucun signal n'a 
ete detecte dans les gonades males, ce qui suggere que I'expression des 
genes hOBPII mise en evidence dans les experiences de RT-PCR 
correspondait k la presence de canaux additionnels dans la 
preparation tissulaire (rete testis et canaux efferents). En combinant 
ces resultats de la detection de I'ensemble des ARNm codant pour 
hOBPII avec ceux de I'approche RT-PCR, il est apparu que cinq 
proteines hOBPII (hOBPIIaa, hOBPIIap, hOBPIIay. hOBPIIba. hOBPIIbp) 
sont secretees par les cellules epithefiales des canaux des gonades 
mSles, ainsi que des cellules acineuses du m€at moyen et des comets 
nasaux ; dans ces cellules les ARNm codant pour hOBHIa sont 
hautement predominant. Seules les deux proteines hOBPHb 
(hOBPIIba et hOBPIIbp) sont secretees par les cellules epithelio- 
glandulaires de la prostate et des glandes mammaires. 



Exemple 6 : Analyse phylogenetique et classification des 
lipocalines 

L'analyse en dotplot (figure 2) ainsi que les duplications 
genomiques que nous avons reveiees indiquent una origine commune 
des genes LCNl et hOBPII. Pour clarifier les relations entre les 
membres de la famille des lipocalines et pour verifier que nous avons 
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identifie le gene humain orthologue de OBPII de rat (Dear et cd., 1991), 
nous avons construit un arbre de distance phylogenetique avec les 
lipocalines des vertebres (figure 8). 

Les inventeurs ont mis en evidence neuf groupes principaux de 
5 lipocalines issus d*un precurseur commun : 

- la famille de rapolipoproteine et de la proteine de liaison au 
retinol (RBP) (groupe 1) ; 

- le groupe de la prostaglandine D-synthase et du precurseur 
de lipocaline associe a la gelatinase des neutrophiles (groupe 

.0 2) ; 

- la sous-famiUe de I'alpha- 1-microglobuline/bikunin (proteine 

HC) (groupe 3) ; 

- la sous-famille orosomucoide (AlAG, AlAH, AlAI) (groupe 4) 

- la sous-famiUe de la sphere orale 1 (OBPH-type-LCNl/VEGP, 
15 VNSP I et II, LALP, CanFl) (groupe 5) ; 

- la sous-famille de la lactoglobuline (groupe 6) ; 

- la sous-famUle des proteines secretees par I'epididyme de 
lezard (groupe 7) ; 

- la sous-famille la sphere orale 2 (proteines urinaires 
20 majeures (MUP) de souris) (groupe 8) ; 

- la sous-famille de la sphere orale 3 (OBPl, OBPII de souris, 
Aphrodisine, Probasine, BD20) (groupe 9). 

La presente invention conceme plus particuUerement les 
groupes 5, 8 et 9. 

25 Le groupe 5 contient les proteines hOBPII qui sont etroitement 

U6es d'un point de vue evolutif a I'OBPIl de rat. Pris dans leur 
ensemble, les presents resultats indiquent que les genes hOBPII 
humains sont orthologues du gene OBPII de rat. Ce groupe contient 
egalement les proteines LCNl-VEGP de differentes especes. En prenant 

30 en consideration I'organisation genomique des genes hOBPII-LCNl, les 
donnees de I'arbre illustrent I'evenement de dupUcation (fleche) qui 
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donne naissance aux genes ancestraux hOBPII et LCNl a partir de leur 
precurseur lipocaline commun (Figure 9). Plus recemment, les 
duplications originelles de la region de 50 kb contenant hOBPII-LCNl 
(fleche) ont genere chez momme les deux gdnes hOBPII et le gene 
LCNl et son pseudogene LCNlb. La dupUcation additionnelle ayant 
donne lieu au pseudogene LCNlc est partielle dans le genome humain 
et ne produit pas de proteine fonctionnelle et est done absente du 
present arbre. De plus, les deux proteines VEG du rat sont plus 
etroitement liees I'une a I'autre dans I'arbre phylogenetique qu'avec la 
proteine humaine LCNl. La situation est identique pour les deux 
proteines humaines OBPII par rapport a la proteine OBPII de rat. Ces 
resultats sont en faveur d*un processus de conversion genique pour au 
moins certains genes des lipocalines. Ceci peut egalement etre correle 
au fait que ces genes se situent sur le meme bras chromosomique. 

Le groupe 9 correspond ^ la famille de la sphere orale 3 et 
contient des OBP qui ont deja ete decrites. La proteine Aphrodisine a 
ddja ete decrite comme un transporteur de pheromone (Henzel et al., 
1988) et apparait etre orthologue a la proteine OBPl de rat et de 
souris, avec deux genes OBPl paralogues. Finalement, les Upocalines 
olfactives produites par les glandes de Bowman de rana pipens (OLFA 
RANPI) qui sont considerees comme des transporteurs d*odeurs 
potentiels dans le mucus de la grenouille, ne sont li6es a aucun groupe 
d'OBP putatif (groupes 5, 8 et 9) suggerant ainsi I'existence d'autres 
categories d'OBP. 

Certaines lipocalines ont ete decrites comme allergenes. 
L'aUergene majeur du chien, la proteine CanFl majoritairement 
exprimee dans les glandes de von Ebner (Konieczny et al, 1997), 
apparait dans I'arbre etre la proteine VEG du chien. Ce r^sultat 
montrant que LCNl peut etre allergenique, pousse les inventeurs a 
proposer I'implication des proteines OBPII dans les processus 
alleiigiques. De la meme maniere, I'allergene majeur du cheval EquCl 
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exprime dans le foie, dans les glandes salivaires (Gregoire et al., 1996) 
apparait €tre orthologue a un membre de la proteine MUP (groupe 3). 
L'allergene majeure de la vache (BD20 BOSTA) qui est present dans la 
famine de la sphere orale 2 (groupe 4) est davantage U6 a la probasine. 
CanF2 principalement exprimee dans la glande parotide (Konieczny et 
cd., 1997) ne semble pas etre orthologue a une lipocaline prealablement 
decrite. 

La presente invention a permis de revele I'existence dHine 
dupUcation genomique au locus q34 du chromosome 9 humain qui 
recele une famiUe de gene du type LCNl ; cette famille compprte outre 
le gene LCNl, precedemment decrit, deux pseudogenes ainsi que deux 
genes hOBPII qui sont paralogues a LCNl. Les inventeurs ont revele 
que la famille hOBPII-LCNl resulte d'evenements consfecutifs de 
dupUcations genomiques. Les sequences ainsi que I'oiganisation 
genomique ont revele que les genes LCNl et hOBPII derivent dMn 
ancetre commun et ont ete genere au moyen de dupUcation en tandem. 
Les comparaisons de sequences ont demontre que les proteines 
hOBPIlaa et hOBPIIba sont les formes de proteines des hOBPII les plus 
proches de LCNl; ceci est corrobore par le fait que la taiUe de I'exon 5 
de LCNl est de 121 pb, ce qui correspond a la taille de I'exon 5a de la 
proteine hOBPII et par le fait qu'aucun exon 3b n'ait ae trouvc dans la 
proteine LCNl. Des resultats similaires sont obtenus lorsque cette 
comparaison est effectuee avec les sept autres exons des Upocalines. 
Ces donnees sont en faveur d'une acquisition de la diversite des 
proteines hOBPII a travers I'integration de d'ADN genomique 
additionnel environnant au niveau du site accepteur d'epissage amont 
pour I'exon 5 de hOBPIIa ou a travers le recnitement d'un exon 
sumumeraire (exon 3b) pour la proteine hOBPIIb. L'hypothese d'un 
recnitement d'exons plutot quMne reduction de la taille des exons ou 
qu'une perte d'exons est plus probable. 
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Les inventeurs ont montre que les genes hOBPII et LCNl cedent 
pour des proteines impliquees dans differentes fonctions, comme le 
montre Texpression de ces genes & la fois dans la sphere orale et dans 
la sphere genitale. De plus, les inventeurs ont montre par I'analyse 
phylogenetique (exemplc 6) que plusieurs proteines differentes 
pouvaient participer k la meme fonction d'odorant-binding proteine ; 
ainsi trois sous-families de lipocalines (les groupes 5, 8 et 9) 
correspondant ^ plusieurs proteines sont retrouvees exprimees dans la 
sphere orale et notamment dans les glandes nasales et buccales. 

Cette analyse montrant que plusieurs lipocalines participent a 
une meme fonction physiologique et qu'une meme proteine pouvait 
participer a differentes fonctions, a conduit les inventeurs a analyser 
I'expression des autres lipocalines humaines dans rensemble des 
tissus etudies (Figure 10). Ced a conduit a montrer que le gene codant 
pour I'apolipoproteine D est exprime dans les glandes du comet nasal 
et du meat moyen, en faisant ainsi une potentielle odorant-binding 
proteine. De meme la retinol-binding proteine (RBP) est exprimee par 
Tepithelium nasal et pourrait: aussi participer a cette fonction. 

Les inventeurs proposent done d'inclure les proteines ApoD et 
RBP dans la famille des OBP humaines et les incluent dans I'ensemble 
des revendications portant sur ces OBP humaines. 

Les inventeurs ont deniontre que la transcription des deux genes 
hOBPIl genere de nombreux transcrits altematifs qui codent pour des 
proteines distinctes dont la structure est compatible avec celle d'un 
transporteur de ligand hydrophobe, 

Les inventeurs ont mis en evidence I'expression des deux genes 
hOBPII dans la sphere orale (glandes nasales, glandes de von Ebner, 
glandes sous-maxillaires, glandes laciymales, poumon). Les inventeurs 
ont egalement demontre que les proteines hOBPlI selon I'invention 
sont produites par les cellules de la sphere genitale ; le gene hOBPH est 
majoritairement exprime dans la prostate, le canal deferent et les 
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glandes mammaires alors que Texpression du gene hOBPIIa est 
restreinte au canal deferent. Les analyses in situ ont revele que I'ARNm 
est produit par les ceUules glandulaires de la prostate et des cellules 
secretrices epitheliales du canal deferent supportant Fidee d'une 
secretion des prot6ines correspondantes dans le fluide seminal. Les 
proteines selon rinvention sont done susceptibles d'etre impUquees 
dans la fonction de reproduction, mais egaJement dans toutes les 
autres fonctions habituellement attribuees aux lipocalines. 



) 

Exemple 7 : Fabrication d»ime protSine recombinante hOBPIIba 
dans tin systeme procaryote. 

Une PGR sur I'ADN plasmidique d*un clone de hOBPIIba a I'aide 
des amorces Blla/b (5' GTC GGA TCC CTG TCC TTC ACC CTG GAG G 
5 3% oligonucleotide sens demarrant 45 bases apres I'ATG initiant la 
pr^teine, et Xllb ( 5' GTC CTC GAG GTG TTC GGG AAC GCA GCT TC 
3% oligonucleotide antisens precedant le codon stop de la proteine 
hOBPIIba, a permis d'amplifier la totalite de I'ADN codant pour la 
proteine hOBPIIba secret€e. Les sites de restriction en2ymatique BamH 
0 I et Xho I situ6s aux extr^mites des deux oUgonucl6otides (bases 
souUgnees), furent utilises pour un clonage directionnel dans un 
vecteur plasmidique d'expression pGEX-6Pl, suivl d^lne 
transformation par electroporation (1800V, 200a, 25nF) dans une 
souche bacterienne BL21. La synthese de la proteine recombinante est 
25 obtenue par ajout dlPTG a raison de 5 mM final pendant 3 h dans 250 
ml de culture de la souche en miUeu LB contenant 100 Mg/ml 
d'ampiciUine prealablement incubee a 37''C pendant 2 h. Les cultures 
centrifugees sont reprises dans 25 ml de tampon TENGN. Le lysat est 
Sonique et centrifuge a nouveau. La proteine de fusion est alors 
purifiee a I'aide de 4 ml de billes fixant de fagon covalente du 
glutathion insoluble (Sigma) pour 25 ml de sumageant. Apres 4 h 
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d'incubation, dies sont lavees avec 3 volumes de NaCl IM puis par 10 
volumes de PBS IX. L'elution est obtenue par mise en contact des 
billes pendant 10 min avec une solution de glutathion (Glutathion 
reduit 10 mM, Tris-HCl pH 8,0 50 mM). 
5 La quantite de proteine recombinante produite est estimee par 

migration en gel de polyacrylamide et coloration au bleu de Coomassie 
(Figure 11). La specificite de I'induction d\ine proteine recombinante 
est testee par Western blot a I'aide d'un anticorps anti-GST de chevre 
(Figure 11), revele avec un anticorps anti-IgG de chevre coupia 4 la ^ 
10 peroxydase en utilisant un kit ECL+plus (Amersham). La separation de 
la proteine de fusion en deux proteines est obtenue par proteolyse de 
100 Jig de proteine recombinante pr6alablement dialysee a Taide de 2U 
de preScission™ protease (Pharmacia Biotech) dans 10 pi final 
contenant du tampon de I'enzyme IX, pendant 4 h 4 5'C- 

15 

Exemple 8 : Detection des hOBPII dans diffexents tissus par 
immunohistocliimie. 

La localisation des proteines hOBPn au sein des structures 
nasales (figure 12), des structures buccales et des glandes lachiymales 
20 (figure 13), des glandes mammaires et des poumons (figure 14) est ^ 
revelee par immunohistochimie. 
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LISTAGE DB SEQUENCES 

<110> UNIVERSITE D'AUVERGNE CLERMONT I 

<120> « ODORANT-BINDING » PROTEINES HOMAINES FIXANTS DES LIGANDS 
HYDROPHOBES^^^^^^^ ET POLYNUCLEOTIDES CODANT LESDITS POLYPEPTIDES, ET 
LEURS APPLICATIONS 

<130> D15947 
<160> 16 

<170> Patentin Vers- 2.0 



<210> 1 
<211> 676 
20 <212> ADN 

<213> Homo sapiens 

<220> 
<221> CDS 
25 <222> (43) .. (552) 

<223> CDNA396 (676) /gl (hOBPIIa-alpha) 



45 



50 



:JccUt,. cct,ccg.9, tcaccc .,.,=t=t,, ..9 .cc ct, 

1 



^^i zi s III s til s s: IT. re| 

35 5 10 15 



IX IK IX til III ?s If, ?s ?s ?2 IS SI ?2 
- 17, Si s IX Sp s 5S SI s ?2 ^r. r.: 

40 

?2 g? If, III '^i '^i ?k? r.: 

55 60 

SI SK SI f.: r,! -Js si si si si ?s 

70 ''^ 

IX IX s iij IS XI ti: IS ii; si is si s 

55 85 90 55 

ctg cag gag ctg ccc ggg acg gac gac tac gtc ttt tac tgc aaa gac 



102 



150 



246 



294 



342 



390 



61 



Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe Tyr Cys Lys Asp 
105 110 

cag cgc cgt ggg ggc ctg cgc tac atg gga aag ctt gtg ggt agg aat 438 
:> Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu Val Gly Ara Asn 
120 125 130 

cct aat acc aac ctg gag gcc ctg gaa gaa ttt aag aaa ttg gtg cag 486 
Pro Asn Thr Asn Leu Glu Ala Leu Glu Glu Phe Lys Lys Leu Val Gin 
10 135 140 145 



15 



cac aag gga etc teg gag gag gac att ttc atg ccc ctg cag acg gga 534 
His Lys Gly Leu Ser Glu Glu Asp He Phe Met Pro Leu Gin Thr Glv 
150 155 160 

age tgc gtt etc gaa cac taggcagcee ccgggtctgc acetceagaQ 582 
Ser Cys Val Leu Glu His 
165 170 

20 cecaccctac caceagacae agageccgga ecacetggae ctaccetcca gceatgaecc 642 
ttecctgctc ceacecaect gaetecaaat aaag 

25 <210> 2 

<211> 170 
<212> PRT 
<213> Homo sapiens 

30 <400> 2 

Met Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
15 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lvs 
35 20 25 30 

Ala Met Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Ara Lvs 
35 40 45 

40 Val Ser Pro Val Lys Val Thr Ala Leu Gly Gly Gly Asn Leu Glu Ala 
50 55 60 
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Thr Phe Thr Phe Met Arg Glu Asp Arg Cys He Gin Lys Lys He Leu 
65 70 75 80 

Met Arg Lys Thr Glu Glu Pro Gly Lys Phe Ser Ala Tyr Gly Gly Arg 
85 90 95 



Lys Leu He Tyr Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe 
50 100 105 110 

Tyr Cys Lys Asp Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu 
115 120 125 

55 Val Gly Arg Asn Pro Asn Thr Asn Leu Glu Ala Leu Glu Glu Phe Lys 
130 135 140 

Lys Leu Val Gin His Lys Gly Leu Ser Glu Glu Asp He Phe Met Pro 



20 



35 



145 



62 



150 155 160 



Leu Gin Thr Gly Ser Cys Val Leu Glu His 
165 



<210> 3 
<211> 725 
<212> ADN 
10 <213> Homo sapiens 

<220> 
<221> CDS 
<222> (43) . . (480) 
15 <223> CDNA396 (725) /SM12 (hOBPIIa-beta) 



i^ccLgtga cCgccgagg tcggcagcac agagCctgg ag atg aag acc ctg 54 

1 



III ill s ir. S2 111 q m ni q 



ss s s? - ?2 ^? 53 

25 30 

- lii Sp s ti; '^i q m tii in iii it. fi 



ill s s III % III - - i - - - 

55 



s SI c?: r.! r,: ?s ?s 

c« «= a.. t« a,c go, tat aa, etc at. tac 

Glu Glu Pro Gly Lys Phe Ser Ala Tyr faiy '^^Y « ^ 
85 

" - 12 S2 Tt: IS s Sp f.: '.^e in i Sp 

105 

- Ta S ?S IS - - IS V-! IS 7?. in 

120 125 

tat ccc cac gtc ggc tea cct ggc cac etc acc tgc agg 
55 Sg cTs ITo Sis ?al lly Ser Pro Gly His Leu Thr Cys Arg 



102 



198 



246 



294 



342 



438 



480 



taggaatcct aataccaacc tggaggccct ggaagaattt aagaaattgg tgcagcacaa 540 
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«,.c.o.c, ^^^^^^^^ ^^^^^^^^ ^^^^^^^^^ 

=t.,,c,,cc <=c=„,tct, cacctcc. ,ccc=cct, cca=„,.„ 

ac=,c«,,a ccccctcc a,ccat,.cc c«ccc.,« cccaccccc .,a«cca. 
taaag 



10 



15 



<210> 4 

<211> 146 

<212> PRT 

<213> Homo sapiens 



<400> 4 

M« 1,,= Th. ..e «y V.1 Thr I.„ .1, ^„ ^. 
20 s.r PH, Th. X.U alu alu OXu xle Th. o.y Th. Trp T.r Va^l Ly= 



25 30 



«a Met V.X V.l ^p p,, 

4 5 

val s.r Pro Val Ly= V.I Thr L,„ oly cly oly ^„ ^„ 

60 

Thx Pho Thr Ph, „,t A,, ^p 

80 

Met AT, Ly. T., Cl„ oi„ ^„ 



30 



90 95 



35 Lys Leu lie ryr .eu Oln Clu .eu Pjo Cly Thr .sp ryr Val Phe 

■^"^ 110 
Tyr cy, x.y, A,p ^, ^„ 

40 125 

val «ly P.„ cy, Ar, Cya P„ „la V.I «y Sa. p„ ^„ 



"5 



Cys Arg 
45 145 



725 



<210> 5 
<211> 741 
50 <212> ADN 

<213> Homo sapiens 



<220> 
<221> CDS 
55 <222> (43) , . (726) 

<223> CDNA396 (741) /SM4 (hOB PI I a -gamma) 
<400> 5 



64 



20 



40 



cgcccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 

Met Lys Thr Leu 
1 



54 



5 ttc ctg ggt gtc acg etc ggc ctg gcc get gcc ctg tec ttc acc ctg 102 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe Thr Leu 
5 10 15 20 

gag gag gag gat ate aca ggg acc tgg tac gtg aag gcc atg gtg gtc 150 
10 Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys Ala Met Val Val 

25 30 35 

gat aag gac ttt ccg gag gac agg agg ccc agg aag gtg tec cca gtg 198 
Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys Val Ser Pro Val 
15 40 45 50 

aag gtg aca gcc ctg ggc ggt ggg aac ttg gaa gcc acg ttc acc ttc 246 
Lys Val Thr Ala Leu Gly Gly Gly Asn Leu Glu Ala Thr Phe Thr Phe 
55 60 65 



atg agg gag gat egg tgc ate cag aag aaa ate ctg atg egg aag acg 294 
Met Arg Glu Asp Arg Cys He Gin Lys Lys He Leu Met Arg Lys Thr 
70 75 80 



25 gag gag cct ggc aaa ttc age gcc tat ggg ggc agg aag etc ata tac 342 

Glu Glu Pro Gly Lys Phe Ser TVla Tyr Gly Gly Arg Lys Leu He Tyr 

85 90 95 100 

ctg cag gag ctg ccc ggg acg gac gac tac gtc ttt tac tgc aaa gac 390 

30 Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe Tyr Cys Lys Asp 

105 110 115 

cag cgc cgt ggg ggc ctg cgc tac atg gga aag ett gtg gca tct get 438 

Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu Val Ala Ser Ala 

35 120 125 130 

ccc tgc agg gcc gtg ccg ctg tec cca cgt egg etc acc tgg cca cct 486 

Pro Cys Arg Ala Val Pro Leu Ser Pro Arg Arg Leu Thr Trp Pro Pro 

135 140 145 



cac ctg cag gta gga ate eta ata cca acc tgg agg ccc tgg aag aat 534 
His Leu Gin Val Gly He Leu He Pro Thr Trp Arg Pro Trp Lys Asn 
150 155 160 



45 tta aga aat tgg tgc age aca agg gac tct egg agg agg aca ttt tea 582 

Leu Arg Asn Trp Cys Ser Thr Arg Asp Ser Arg Arg Arg Thr Phe Ser 
165 170 175 180 

tgc ccc tgc aga egg gaa get gcg ttc teg aac act agg cag ccc ccg 630 

50 Cys Pro Cys Arg Arg Glu Ala Ala Phe Ser Asn Thr Arg Gin Pro Pro 

185 190 195 

ggt ctg cac etc cag age cca ccc tac cac cag aca cag age ccg gac 678 

Gly Leu His Leu Gin Ser Pro Pro Tyr His Gin Thr Gin Ser Pro Asp 
55 200 205 210 

cac ctg gac eta ccc tec age cat gac cct tec ctg etc cca ccc ace 726 

His Leu Asp Leu Pro Ser Ser His Asp Pro Ser Leu Leu Pro Pro Thr 



65 



10 



15 



25 



30 



40 



215 

tgactccaaa taaag 

<210> 6 
<211> 228 
<212> PRT 

<213> Homo sapiens 



220 



225 



<400> 6 

Met Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 

^ 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp lie Thr Gly Thr Trp Tyr Val Lys 



30 



75 80 



Ala Met Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys 
20 ^° 45 

val ser Pro Val Lys Val Thr Ala Leu Gly Gly Gly Asn Leu Glu Ala 

55 60 

Thr Phe Thr Phe Met Arg Glu Asp Arg Cys lie Gin Lys Lys He Leu 

Met Arg Lys Thr Glu Glu Pro Gly Lys Phe Ser Ala Tyr Gly Gly Arg 
85 90 gl ^ 

Lys Leu He Tyr Leu Gin Glu Leu Pro Gly Thr Asp Asp Tyr Val Phe 
100 105 

Tyr Cys Lys Asp Gin Arg Arg Gly Gly Leu Arg Tyr Met Gly Lys Leu 
35 120 125 

val Ala ser Ala Pro Cys Arg Ala Val Pro Leu Ser Pro Arg Arg Leu 

J. O 



140 



Thr Trp Pro Pro His Leu Gin Val Gly He Leu He Pro Thr Trp Arg 

155 160 

Pro Trp Lys Asn Leu Arg Asn Trp Cys Ser Thr Arg Asp Ser Arg Arg 
165 170 175 

45 Arg Thr Phe Ser Cys Pro Cys Arg Arg Glu Ala 



180 185 



Ala Phe Ser Asn Thr 
190 

Arg Gin Pro Pro Gly Leu His Leu Gin Ser Pro Pro Tyr His Gin Thr 
50 205 

Gin Ser Pro Asp His Leu Asp Leu Pro Ser Ser His Asp Pro Ser Leu 



220 



Leu Pro Pro Thr 
55 225 



741 



<210> 7 



30 



66 



<211> 607 
<212> ADN 
<213> Homo sapiens 

5 <220> 

<221> CDS 

<222> (43) , . (483) 

<223> CDNA396 (607) - forme courte (hOBPI la-delta) 
10 <400> 7 

cgcccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 54 

Met Lys Thr Leu 
1 

15 ttc ctg ggt gtc acg etc ggc ctg gcc get gcc ctg tec ttc acc ctg 102 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe Thr Leu 
5 10 15 20 

gag gag gag gat gag gga gaa teg gtg cat cca gaa gaa aat cct gat 150 
20 Glu Glu Glu Asp Glu Gly Glu Ser Val His Pro Glu Glu Asn Pro Asp 

25 30 35 

gcg gaa gac gga gga gcc tgg caa att cag cgc eta tgg ggg cag gaa 198 
Ala Glu Asp Gly Gly Ala Trp Gin lie Gin Arg Leu Trp Gly Gin Glu 
25 40 45 50 

get cat ata cct gca gga get gcc egg gac gga cga eta cgt ctt tta 246 
Ala His lie Pro Ala Gly Ala Ala Arg Asp Gly Arg Leu Arg Leu Leu 
55 60 65 



ctg caa aga cca gcg ccg tgg ggg cct gcg eta cat ggg aaa get tgt 294 
Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Leu His Gly Lys Ala Cys 
70 75 80 



35 ggc ate tgc tec ctg cag ggc cgt gcc get gtc cec acc ttg get eac 342 
Gly lie Cys Ser Leu Gin Gly Arg Ala Ala Val Pro Thr Leu Ala His 
85 90 95 100 

ctg gcc acc tea cct gca ggt agg aat cct aat acc aac ctg gag gee 390 
40 Leu Ala Thr Ser Pro Ala Gly Arg Asn Pro Asn Thr Asn Leu Glu Ala 

105 110 115 

ctg gaa gaa ttt aag aaa ttg gtg cag cgc aag gga etc teg gag gag 438 
Leu Glu Glu Phe Lys Lys Leu Val Gin Arg Lys Gly Leu Ser Glu Glu 
45 120 125 130 

gac att ttc atg cec ctg cag acg gga age tgc gtt etc gaa cac 483 
Asp lie Phe Met Pro Leu Gin Thr Gly Ser Cys Val Leu Glu His 
135 140 145 

50 

taggcagcee eegggtetge acctecagag cecaccctae caccagacac agageccgga 543 
ecacctggac etaceetcea gccatgaecc ttccctgetc ceacccacet gactccaaat 603 
55 aaag 607 



<210> 8 



• # 

67 



<211> 147 
<212> PRT 
<213> Homo sapiens 

5 <400> 8 

Met Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
^ ^ 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp Glu Gly Glu Ser Val His Pro Glu 
20 25 30 

Glu Asn Pro Asp Ala Glu Asp Gly Gly Ala Trp Gin He Gin Arg Leu 

40 45 

15 Trp Gly Gin Glu Ala His He Pro Ala Gly Ala Ala Arg Asp Gly Arg 



25 



35 



60 



Leu Arg Leu Leu Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Leu His 

20 ^° 80 

Gly Lys Ala Cys Gly He Cys Ser Leu Gin Gly Arg Ala Ala Val Pro 
85 90 95 

Thr Leu Ala His Leu Ala Thr Ser Pro Ala Gly Arg Asn Pro Asn Thr 
100 105 

Asn Leu Glu Ala Leu Glu Glu Phe Lys Lys Leu Val Gin Arg Lys Gly 
115 120 125 

30 Leu Ser Glu Glu Asp He Phe Met Pro Leu Gin Thr Gly Ser Cys Val 



140 



Leu Glu His 
145 



<210> 9 
<211> 676 
<212> ADN 
40 <213> Homo sapiens 

<220> 
<221> CDS 
<222> (43).. (552) 
45 <223> CDNA2098 (676) - forme classique (hOBPIIb-alpha) 

<400> 9 

cgcccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 54 
50 Met Lys Thr Leu 



1 



ttc ctg ggt gtc acg etc ggc ctg gcc get gee ctg tec ttc acc eta 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Xla Leu Ser Ihl Leu 
55 ^° 15 20 



102 



gag gag gag gat ate aca ggg acc tgg tac gtg aag gee atg gtg gtc 150 
Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys Ila Me? vll vll 
25 30 35 



68 



gat aag gac ttt ccg gag gac agg agg ccc agg aag gtg tec cca gtg 
Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys Val Ser Pro Val 
40 45 50 



198 



aag gtg aca gcc ctg ggc ggt ggg aag ttg gaa gcc acg ttc acc ttc 246 
Lys Val Thr Ala Leu Gly Gly Gly Lys Leu Glu Ala Thr Phe Thr Phe 
55 60 65 



294 



342 



390 



438 



486 



10 atg agg gag gat egg tgc ate cag aag aaa ate ctg atg egg aag acg 
Met Arg Glu Asp Arg Cys lie Gin Lys Lys He Leu Met Arg Lys Thr 
70 75 80 

gag gag cct ggc aaa tac age gcc tat ggg ggc agg aag etc atg tac 
15 Glu Glu Pro Gly Lys Tyr Ser T^a Tyr Gly Gly Arg Lys Leu Met Tyr 
85 90 95 100 

ctg cag gag ctg ccc agg agg gac eac tac ate ttt tac tgc aaa gac 
Leu Gin Glu Leu Pro Arg Arg Asp His Tyr He Phe Tyr Cys Lys Asp 
20 105 110 115 

cag cae cat ggg ggc ctg etc eac atg gga aag ctt gtg ggt agg aat 
Gin His His Gly Gly Leu Leu His Met Gly Lys Leu Val Gly Arg Asn 
120 125 130 

25 

tct gat ace aac egg gag gcc ctg gaa gaa ttt aag aaa ttg gtg cag 
Ser Asp Thr Asn Arg Glu Ala Leu Glu Glu Phe Lys Lys Leu Val Gin 
135 140 145 

30 egc aag gga etc teg gag gag gac att ttc acg ccc ctg cag acg gga 
Arg Lys Gly Leu Ser Glu Glu Asp He Phe Thr Pro Leu Gin Thr Gly 
150 155 160 

age tgc gtt ccc gaa eac taggcagcec ccgggtctgc acctccagag 
35 Ser Cys Val Pro Glu His 
165 170 

cccaccctae eaccagacae agagecegga ecaectggac ctaccctcea geeatgacce 642 
40 ttccctgctc ceacccacct gaetccaaat aaag 676 

<210> 10 

<211> 170 

45 <212> PRT 

<213> Homo sapiens 

<400> 10 

Met Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
50 1 5 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp He Thr Gly Thr Trp Tyr Val Lys 
20 25 30 

55 Ala Met Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys 
35 40 45 

Val Ser Pro Val Lys Val Thr Ala Leu Gly Gly Gly Lys Leu Glu Ala 



534 



582 



• # 

69 



55 eo 



Thr Phe Thr Phe Met Arg Glu Asp Arg Cys lie Gin Lys Lys He Leu 

'^^ 80 
Met Arg Lys Thr Glu Glu Pro Gly Lys Tyr Ser Ala Tyr Gly Gly Arg 

95 

Lya Leu Met Tyr Leu Gin Glu Leu Pro Arg Arg Asp His Tyr He Phe 

110 

Tyr Cys Lys Asp Gin His His Gly Gly Leu Leu His Met Gly Lys Leu 

120 

15 val Gly Arg Asn Ser Asp Thr Asn Arg Glu Ala Leu Glu Glu Phe Lys 



10 



40 



140 



Lys Leu Val Gin Arg Lys Gly Leu Ser Glu Glu Asp He Phe Thr Pro 
20 160 
Leu Gin Thr Gly Ser Cys Val Pro Glu His 
165 

25 <210> 11 
<211> 782 
<212> ADN 
<213> Homo sapiens 

30 <220> 

<221> CDS 

<222> (1) , . (537) 

<223> CDNA2098 (782) - forme longue (hOBPIIb-beta ) 
35 <400> 11 

^ ?s ^ til III til SI til fii 2; ^? SI 



10 



15 



22 li: q til ?s ?s ii: m tii tii fii fit q i^i 



45 



50 



48 



96 



« iti IK iL' III z ti: ?s III ;s m iTr ?:! lit 111 til 



?a ?:r til III III q ir. - - - - 

60 

ill ill ;s s 22 IS - - - «j ^« 

?S III tit til IS Zl til lit Ill III III III til ill ti 



70 



30 



45 



aag acg gag gag cct ggc aaa tac age gcc tgc ttg tec gca gtc gag 336 

Lys Thr Glu Glu Pro Gly Lys Tyr Ser Ala Cys Leu Ser Ala Val Glu 
100 105 110 

5 

atg gac cag ate acg cct gcc etc tgg gag gcc eta gcc att gac aca 384 

Met Asp Gin lie Thr Pro Ala Leu Trp Glu Ala Leu Ala lie Asp Thr 
115 120 125 

10 ttg agg aag ctg agg att ggg aca agg agg cca agg att aga tgg ggg 432 
Leu Arg Lys Leu Arg lie Gly Thr Arg Arg Pro Arg lie Arg Trp Gly 
130 135 140 

cag gaa get cat gta cct gca gga get gcc cag gag gga cca eta cat 480 
15 Gin Glu Ala His Val Pro PJia Gly Ala Ala Gin Glu Gly Pro Leu His 
145 150 155 160 

ctt tta ctg caa aga cca gca cca tgg ggg cct get cca cat ggg aaa 528 
Leu Leu Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Pro His Gly Lys 
20 165 170 175 

get tgt ggg taggaattet gataecaace gggaggccct ggaagaattt 577 
Ala Cys Gly 

25 aagaaattgg tgcagegcaa gggactcteg gaggaggaca tttteacgce eetgcagacg 637 
ggaagctgcg tteccgaaea ctaggeagee ccegggtctg eacetccaga geecaceeta 697 
ecaccagaca cagagcccgg aeeacctgga cetaccetcc agceatgaee ettceetgct 757 
cecacccace tgactccaaa taaag 



782 



<210> 12 
35 <211> 179 
<212> PRT 

<213> Homo sapiens 
<400> 12 

40 Arg Pro Val Thr Cys Arg Gly Arg Gin His Arg Ala Leu Glu Met Lys 
1 5 . 10 15 

Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe 
20 25 30 



Thr Leu Glu Glu Glu Asp lie Thr Gly Thr Trp Tyr Val Lys Ala Met 
35 40 45 



Val Val Asp Lys Asp Phe Pro Glu Asp Arg Arg Pro Arg Lys Val Ser 
50 50 55 60 

Pro Val Lys Val Thr Ala Leu Gly Gly Gly Lys Leu Glu Ala Thr Phe 
65 70 75 80 

55 Thr Phe Met Arg Glu Asp Arg Cys lie Gin Lys Lys lie Leu Met Arg 

85 90 95 



Lys 



Thr Glu Glu Pro Gly Lys Tyr Ser Ala Cys Leu Ser Ala Val Glu 



30 



35 



40 



45 



50 



71 



100 105 



110 



Met Asp Gin He Thr Pro Ala Leu Trp Glu Ala Leu Ala lie Asp Thr 
5 115 120 125 

Leu Arg Lys Leu Arg He Gly Thr Arg Arg Pro Arg He Arg Trp Gly 
130 135 j^^Q 

in ?ic ^^-^ ^""^ ^« Ala Gin Glu Gly Pro Leu His 

150 155 160 

Leu Leu Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Pro His Gly Lvs 
165 170 17I 

15 Ala Cys Gly 



<210> 13 
20 <211> 542 
<212> ADN 
<213> Homo sapiens 

<220> 
25 <221> CDS 

<222> (43) .. (297) 

<223> CDNA2098 (542) - forme courte (hOBPIIb-garnma) 



<400> 13 

cgcccagtga cctgccgagg tcggcagcac agagctctgg ag atg aag acc ctg 54 

Met Lys Thr Leu 
1 



ttc ctg ggt gtc acg etc ggc ctg gcc get gee ctg tec tte acc ctg 
Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu Ser Phe Thr Leu 
^ 10 15 20 

gag gag gag gat gag gga gga teg gtg cat eca gaa gaa aat cct gat 
Glu Glu Glu Asp Glu Gly Gly Ser Val His Pro Glu Glu Asn Pro Asp 
25 30 35 

gcg gaa gac gga gga gcc tgg caa att cag cgc eta tgg ggg cag gaa 
Ala Glu Asp Gly Gly Ala Trp Gin He Gin Arg Leu Trp Gly Gin Glu 
40 45 50 

get cat ata cct gca gga get gcc cag gag gga eea eta eat ett tta 
Ala His He Pro Ala Gly Ala Ala Gin Glu Gly Pro Leu His Leu Leu 
55 60 65 

ctg caa aga eca gca eca tgg ggg cct get cca eat ggg aaa get tgt 
Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Pro His Gly Lys Ala Cys 
''O 75 80 



102 



150 



198 



246 



294 



55 Gly ^^^^^^^^'^^ gataecaacc gggaggcect ggaagaattt aagaaattgg 347 
85 



tgcagcgcaa gggactcteg gaggaggaca ttttcacgcc cctgcagaeg ggaagctgeg 407 



20 



m 



72 



ttcccgaaca ctaggcagcc cccgggtctg cacctccaga gcccacccta ccaccagaca 467 
cagagcccgg accacctgga cctaccctcc agccatgacc cttccctgct cccacccacc 527 
tgactccaaa taaag 542 



<210> 14 
10 <211> 85 
<212> PRT 

<213> Homo sapiens 
<400> 14 

15 Met Lys Thr Leu Phe Leu Gly Val Thr Leu Gly Leu Ala Ala Ala Leu 
15 10 15 

Ser Phe Thr Leu Glu Glu Glu Asp Glu Gly Gly Ser Val His Pro Glu 
20 25 30 



Glu Asn Pro Asp Ala Glu Asp Gly Gly Ala Trp Gin lie Gin Arg Leu 
35 40 45 



Trp Gly Gin Glu Ala His lie Pro TVla Gly Ala Pila Gin Glu Gly Pro 
25 50 55 60 

Leu His Leu Leu Leu Gin Arg Pro Ala Pro Trp Gly Pro Ala Pro His 
65 70 75 80 

30 Gly Lys Ala Cys Gly 

85 

<210> 15 
35 <211> 10664 
<212> ADN 

<213> Homo sapiens 
<220> 

40 <223> Gene hOBPIIa 
<400> 15 

ctctgcttct atattcggcc tccaaatctg tgctcaatgc agcaactgga gtgacccctt 60 
45 aaatacgtaa gtcacagctt gcctttgtca gagctatcca gggtctttca ctcagagcag 120 
aagctgaagt cctcgtggtg gtccttaatc cctacatggc cgttccaccc actccccagc 180 
ctcatgtgtg gccggtctcc ctggatcatt tgctgtggct gctctgccgt gtgttcccgg 240 

50 

aaactgccag cgttctccca cctctgggct ggcactggat gctcctgcca cctggactcc 300 
tcttccagct gacgagctca tggcttgctt ccttcatgtc ttaaattcgg tgtttgaatg 360 
55 ccaccttggc gaggctgttc ctcatcaatt catgtaaagg acaaataacc ccttgtctgg 420 
ccactcctgt ccaacttgtc cactttgctt tttccatagc actgatcacc atttaaaata 480 



10 



15 



20 



25 



35 



40 



50 



55 



73 



atgtatgaac cagtgaccca tcagtgacca gagacagtag attgaacagg tattgcttgc 540 
acagtgaaca atcagctcta gaggtttaaa gagaaccaca aagaatggct caggattgca 600 
cgagggcagt taaggaagaa ataaacaggg gtggggatcc tttccacaag tgtgggttca 660 
gaccgcatgg gagaaggtgt ggttctccca agggaagctg gagaagtttg ctgggttgtc 720 
ccagccacag ctggcccacg gtcagggcag aggccagcag gcagggaaat gtaggctggg 780 
tctggcaagc aggaagcctc tcttcccccg caaggcaggt gggctggggc tgggaagcct 840 
acaagagtca ctgggaaccc acaggtgcag atgccactga atctcaatag gaagccatct 900 
gggggggtcc cctgaattca atgtggtgtg tgccgccaga cgtccccaac ttgtgccact 960 
gccatttata caggaagaga aagaaaaagg aagaaatgga agcatctgga accagtcatc 



1020 

ctggacccat gctaggaggt gcttccccct acgcctcaac caacaaagct tagcattqca 
1080 ^ y y 

1140^^^"^ ^^g^gaagcg cctgctggct ccagctccat tgcctcggaa ccagccatga 

agggtgcgtg tggagctgga ggcaagacat tgatagctgg cactgcaatt cacttattta 
1200 

ttttgttcat tttaagtccc ctgcacctag aatataagcc ccccaagcac aggacatttg 
30 1260 

ttttattgat cgatgtattc cttgtgcccc aaagaatgag aggcatctag aaagtctaca 
1320 

aaaatcaaac ataaaaatga acctttattc agtcattgtt attttgatgg atatttaaaa 
1380 ^ 

catttccaag atttgtaagt aacaattgaa cccttctcct ggttcatgtg tgggagtgta 

tctgttcaaa tgatgcttct gagtggagtt gctgagtctt tggctctagg tttttttttt 
1500 

ttaagcattt atgctcattg tggtttttaa attaaacatt taaccctgag acactgtaaa 
45 1560 ^ 

^^cccatgca attgtaaaaa gccacacaga gctatcatgt gtatcttcac ctggcttgct 
1680^^^^^^ ^^^^cra^caat gacagacctg ttctccactc ctgcaatctg ctcattgcaa 

gaatgtcgtc tattgcaatc ataaaattgt gggattggct ttttttttcc tgtgcaacat 
1740 ^ ^ y 



cattctctgg agattcatcc tattgttgca tttatcaata gtttattcca ttttacttct 
1800 




gagtagtgct ctatggtatg gatgtaccac 
1860 

agtctgtgtt tat:agatttg ggcliatgaca 
5 1920 

ttcatttccc tgggacaaag gcccaggggt 
1980 

10 gctcattttg ttttgttttg ctttgtttta 
2040 

agatccagtt tccatgcatc ctcaccaggc 
2100 

15 

ccaccttaat aggtatgtac tgatiatatca 
2160 

atggtgttga gcatcttttc atgtgtttat 
20 2220 

gtcccttcat gtcttttgtt tacgttctat 
2280 

25 ttataaagta tagaaactaa ttctittgttg 
2340 

tctttggctt gtctrtttat tctgttaaca 
2400 ! 

30 

ttgatgaagt ctattttaac aatttttcct 
2460 

aaaacctcct gacccagctc catatgtcaa 
35 2520 

ttttaagttt tatgttgaag tctatgatcc 
2580 

40 gaccaaggtt gtggttcttc tttttctttg 
2640 

cagcccattt gct;acaaaag ctatctttcc 
2700 

45 

aatgtaattg ggtgtatttg tacaggtctg 
2760 

atctatgcat ctgtccatgt gctagctata 
50 2820 

tgtggtggcg agagcctgta atcccagcta 
2880 

55 aacccaggag gtggaggttg cagtgagtca 
2940 




74 

agtctgttta accattcacc tgttggagga 
catgtatagg tttttgcatg gacatcagtt 
tctattgctg gattctatgc ttgttacagg 
ttttgttttt aacctg^caa gccattttcc 
ttcagtatga tcactatgat cttatctcag 
tggcttttat ttgcatttca ctgatgacta 
ttgccatctg tatatcctct ctagtcaagt 
ttttgaaact gttgagtttt gaaaaattct 
aatatgtagt ttgtcaatzat tttctttcag 
gggtctctta cagagcaaaa ggtttttatt 
tttatggatc atatttttgg caacaaatct 
agattttctt gttttctaaa agttttatag 
attttgagtt aattttcata cagggtgtga 
gtggttttgt ctgtggatgt ccagttgctc 
tccactgaat tacttttgca tctttgtaaa 
tttgaggatt ctttattgtc tgtcccattg 
taagtcttga aagggtagcc tgtagctggg 
ttcgggaagt ggaggcagga gaatcgattg 
agatcgtgcc actgcactcc agcctgggtg 



75 



acagagtgaa ctccatataa aaaaataaaa acaaaaataa agtagcgtga 
3060^^''*'^* tttaaaaaag ttttagctat tccagttcct ttgcctttcc 
tagaataatc ttgtctatat ctaccacaat tctttctgga attttgatag 
° I^JS''*^*'** attatttgag agaaatgata tttttactat gttgagtctt 
gatataacgt ctctccattt gtttagatct tctttgattt attttataat 
SSS"^"*" acaaatccag catatgggtt gttagactta tgcctaggca 
ttagccatta taaatagtac tgtgttttta agtttagggt ccattactag 
cacaattgat ctttgtatat ttatcttgtg tcctgcaacc ttgctgaact 
5 ttctaggagg tgtattgttt tcttttgttt tgtttttcaa tttcttggga 
agataataat gtcatctgca gatgcagttt tcttccttcc tttccaattt 
360^''*'''^' ttaaaaaacc tatattactc tgactagaac tttctgtact 
caagtggtag agtggacatc cttgccttgt ccctgatgtt aaagagaaag 
tgagtatccc agcctcaaaa tgtgcttaaa aacttttttc ctttcttgct 
aaacatactt cgaaactctt tatttctccc tttcccacca ggcacttccg 
tcgcttatct aattatgtgc ttacttagaa attccagggg ccaattttga 
gcagagagac ccagctgcag aatcctccct cttaggggga gttacaggta 
tcccggctga aatcaggatg acgcaaacca gacctccgga cagacgattc 



ataaccatca 
4020 



gaacaagatg cagaccaaca tcctcctgca ccattcccat 



caccttttcc tccttaaacc ccttcgctca gtccagaaaa tctgaatggt 



itctcccac 

:ataaattt 

kattttgtt 

:aatccatg 

attgcattg 

ctcattttt 

atgtagaca 

acttactag 

tttctacag 

tatgtcttt 

tgttaaata 

atttgtaac 

tcagccttg 

gagcagtgc 

acaaaccag 

cctaccact 

tgactcaca 

tatttccca 

t'btztaaagg 




76 



catgggtctg gccattcccc aactgccagt atttgaataa agctgctttc cttttaccac 
4140 

acctcacttc tcatgccttg acttctgagc agcgagcagc tggacttgag ccagttacac 
5 4200 

atcagtcttt caccattaga aataatgtag ccataggttt ttttttcgta gatgttcttt 
4260 

10 ttcaagttaa agaagttctc ttctattcct atttttctga gaggtgttat cccgaatgag 
4320 

tgttgaattt tgttaaatac ttttaacaac ccaacaggaa ccaccatcag aagccatcca 
4380 

gagaaacgca ccaggccaca aagcactggg ggccagggat cttgcccctg ctgtctgcca 
4440 

tgggttgacc cccagcctcc aaccctacca tcccctgacg gtgtctgcag cagttgaacc 
20 4500 

caaccagcat ctaaaagaac acagttggtg aacgagactg ggacacaggg caagatgggt 
4560 

25 ggacaatggg aggctcctgg agagcacccg taccagcgag catagaattc atgggggtga 
4620 

cctgttccct gaagcatctg cgcgtgttgt tccagcattt tcttcaagga ttgagccagc 
4680 

30 

agcaccagtg tcatacggtg cttaaatcaa tgattcacag ccaaccaatg aaatacaagg 
4740 

tgccggctgg gcgcggtggc tcacgcctgt aatcccagca ctttgggagg ccgaggcggg 
35 4800 

cggatcacga ggtcaggaga tcgagaccat cccggctaaa acggtgaaac cccgtctcta 
4860 

40 ctaaaaatac aaaaaaaatt agccgggcgt agtggcgggc gcctgtagtc ccagctactt 
4920 

gggaggctga ggcaggagaa tggcgtgaac ccgggaggcg gagcttgcag tgagccaaga 
4980 

45 

tcccgccact gcactccagc ctgggcgaca gagcgagact ccgtctcaaa aaaaaaaaaa 
5040 

aaaaaaaaaa aaaagaaata caaggtgcct ggggtacagg caacaaaaat ggggaacgga 
50 5100 

gaaatcttcc cgttgaggta gagactccag cctgtttgct catctctggt cctgaagagc 
5160 

55 ccagtccccg ccctaaggat ggggtttctg ctcggcagca cttgccgtga gaggggtgag 
5220 



77 



|c,ct,,,tc .c,=c.,c=c tttcttt.., ,ecccca„, „t«t,,a, 
5 ^JSo"'"'' »5.9t,tc., ,tctt,„cc .„„„c.c ,aa,«t„, 

t,,gccc„c ac«,c=t,c .,a,ct,,, tca,cc«„ ,.cc=a„,c ag.t,ac,ca 
10 |,ccc,„aa c.ac„,,.e ca„a„,„ ^^^^^^^^^^ 
|at,a,,cc ,c,,a,cca, ,t,ccca,3, ,„«c„cc a=a,a=t=t, .,caca„ct 
|||a,,t,,c tct.,a.,« .at^ccccc a.ttatctaa a„,at,.,a «ca,„cct 
20 n^r^'"'" "«'«5«cc, tC5aa,cts. C9.sa,.„« gat^^gagt ga.t^t.t.t 
tcc„.ct,c c.ett,«„ t.aca,„a, at,,at,a., ..cac^^ea ,„,«.aa=a 
25 ,,ca,,ac.a tcca,a,a„ tc.c,.,„. .,a,,aca,= ,c„cca,,c tc=,,tac„ 
«|t,aa,c,, ^^^^^^^^^^ ^^^^^^^^^^ ^^^^^^^^^ 

t.et,acctt ,a,ccacac, ata,.,cc=t tctct^cccc ea,g..,«= ,a,t,ca,„ 
35 sIS'''^'' 9..a,t=..t ,ca5.,t<,„ t=„ag.,tg ,<,c„.agct t,„=tctag 

«=gt,c,„ actc.,=t„ ca,ca,c=cc actctctat „„ctaaa, c„a,tc=at 

40 ttct,ctc, =a,„a,a., ,cca,tt=cc oa,a„.ct. ,c=ca„,tc cca,cc,„, 

«JJ5«.9. ,«ca,„„ ,a,„a,,,a ,aatt„,a, ccg.„,„c «=c.«g., 
|ctc,„„, ^^^^^^^^^^ ^^^^^^^^^^ ^^^^^^^^^^ 

50 "-ct„ac a,catc,t,t ,totttt=tt ctct«,«„ 

-«,aa«, ct,ttca=ca ,at,cca,ca at,a,,ac= .ccccotccc „at,ca,,a 
55 «,,«,cca =cat,„,a, ,„t,cacc, t,ccac,t,= ecc=a,„ca «,,cc.„. 
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ggctataaag aacatctcga gaggagccag cacagccttg ttcagacgcc cagtgacctg 
6420 

ccgaggtcgg cagcacagag ctctggagat gaagaccctg ttcctgggtg tcacgctcgg 
5 6480 

cctggccgct gccctgtcct tcaccctgga ggaggaggat gtgagctggg ttggcgtggg 
6540 

10 cggatggagg agccaggtgg actcctgggc agggggcagt gccaggggcc ctgctttagg 
6600 

aggtgtcact taagcctggg gtggtggtgg aggggtccta ttgttccttc agcagacaat 
6660 

15 

gctccccatg aggcccaggg ccggagcagg ctcggctcag gggttcctgc tgcactgacg 
6720 

cctgaagccc gaaggtctcg cagggttggg ccctgtggag ggagggctca cctggtgctg 
20 6780 

gggcccgggg gtccatgggg tgcagacatg ccctccttcc actgggggct gggagccctg 
6840 

25 agcagggggc tggctctaac tcactccagc tgagctctaa ctaaggtgca ggaacccagc 
6900 

ctgcctttag gggtggcagc cgggcaccat gggtgtctgg ttatagctgc aggcctgagt 
6960 

30 

gccagggtca gagtagaatc tgggccaccc atggtgggct cacggccttg gcctgctcca 
7020 

gatcacaggg acctggtacg tgaaggccat ggtggtcgat aaggactttc cggaggacag 
35 7080 

gaggcccagg aaggtgtccc cagtgaaggt gacagccctg ggcggtggga acttggaagc 
7140 

40 cacgttcacc ttcatgtgag tgttgcccac tgcagggccc ctcaggccac tttcgctccc 
7200 

cgccccagac ccacctggtg cccattgccc catccacatt tcgggtgttg ggaagagtca 
7260 

45 

ccccctgcct tggagggaaa cagccagggc atcctgaagc tcggtggggt gggggggcag 
7320 

tggaattttc aggttgccgg gtcagggcca tgcaccaggt gagctgagga tgggccaggt 
50 7380 

gtgtcctggg agccgctgcc cgcgtgtctc ctgttttcca ggagggagga tcggtgcatc 
7440 

55 cagaagaaaa tcctgatgcg gaagacggag gagcctggca aatacagcgc ctgtgagccc 
7500 



• 
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10 



15 



ctccccgacc ccccactccc catgcccaac cccggatgca ccagccccac tgcaggtgga 
gagtgcccag gccacacttc tgccagggtc ccagccctgc ccacctccaa ggaggggctg 
gcctctcctt cctggggggc tggtggccct gacatcagac accaggtgtg acaggcttgt 
ccacagtaga gatggaccag atcaagcctg ccctctggga ggccctagcc attgacacat 
tgaggaatcc gagtgttagg gaccaggagg ccgagggtta gggatgggaa gccaaggctg 
agggtttggg atcaggaatc cgagggttag ggacagggaa gtggggcagg agcagctgct 
20 aggccggact ctagtcctgg acgtgctctg gccttgtggc tccattactt 

gcattgggac cttccgagag gaggctcctg cctccgtgtc cgggtccatg ctgtgcggag 
25 cagccaggcc tggctcaggc tgtccagggc acctgggtga ccactgaaac attcctgagt 
gtttcttcgt gtggtcctga gtgctctctc cgggaatgag ggcactgaag acccatcttc 

30 

tctgtcatct acagatgggg gcaggaagct catatacctg caggagctgc ccgggacgga 
35 ellf ^''^ ttttactgca aagaccagcg ccgtgggggc ctgcgctaca tgggaaagct 

tgtgggtgag gggcccgctg gggcctgcat gtcctgcccc atggtctctg cctccagaag 
40 ccagtggaac caccatcatc acgccctggc acggggggaa aaggaagccc cctgcgccgg 
ccttcgtgtg ctaggcacca agcgctgccc tggatggctg gtccaagttc ctgaagtggg 

45 

agtggggtgg gccaggcagg gacagacacg gccctcggtg acgtgaacct gccaagggcc 
50 fSS^*^^^^^ tctcaggtgt aggggcctca ccttaagggg gaggtancat cttaacagag 
ctcttcatgg ggcagggact ctccagggcg gcagggcagc cagtgcctct gggacacaag 
leJo'"'""^ gtgagggttg tgaccctgca gagtggcttt gggagctgcc caggtccccc 
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tggggttgct gagtggcttg gaccctgcca ctgtcccctt tcctggggac ctctcacctg 
8700 

ggcggtggcc gtctcctctg tccccagtcc cacccctgag ctcttgtcca ttctcaggcc 
5 8760 

tcctctcccc cttgcctggt gctggacagt tgccatctct tctgtcccca gccccacccc 
8820 

10 tgagctctga tccactctcg ggcctctccc ccgtcctgat gctgggccgt ggtcgtctcc 
8880 

ttttagcatc tgctccctgc agggccgtgc cgctgtcccc acgtcggctc acctggccac 
8940 

15 

ctcacctgca ggtaggaatc ctaataccaa cctggaggcc ctggaagaat ttaagaaatt 
9000 

ggtgcagcac aagggactct cggaggagga cattttcacg cccctgcaga cgggtgagga 
20 9060 

cggctgtgcc cagtaccccg tgttcccctg tgtctctgtg tgatctccag tgtcccatga 
9120 

25 ccctcgtgtc ctcccatgtc ccccgcattc cccatgtgcc ccgagtctcc tcgcaggggc 
9180 

tctgggccct gcttagcatc ctcgtcgttg gagggtctgc actctgggct gcgatggggt 
9240 

30 

ctggggctcc gcgctctggg ctgcgatgcg gtctggggct ccgcgctctg ggctgcgatg 
9300 

gggtctgggg ctccgcgctc tgggctgcga tggggtctgg ggctccgcgc tctgggctgc 
35 9360 

gatggggtct ggggctccgc gctctgggct gcgatggggt ctggggctcc gcgctctggg 
9420 

40 ctgcgatggg gtctggggct ccgcgctctg ggctgcgatg gggtctgggg ctccgcgctc 
9480 

tgggctgcga tggggtctgg ggctccgcgc tctgggctgc gatggggtct ggggctctga 
9540 

45 

gctctgggct gcgatggggt ctgggccctg gtctagggcg ccttctaatc cctgggtttt 
9600 

tcttggtctc tgcaggaagc tgcgttctcg aacactaggg tgagtgagcc tttaggaggg 
50 9660 

cactggacaa gcccagagtc ctgggttccc ggggttcgag ggtacatctg ctctggccct 
9720 

55 tcccatccca cacagccagg gagacccccc cagggtcagg cacgaggttg gcacctcaga 
9780 
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gtctgcccac ccaaaattcc tgggacattc gggaagtcct ttgttttacc attcctgcac 
5 99^0"^*'''*' gagtgagggt cctcctcggc ctttccacag cgaggcctcc ctccggctcc 
ctcaggtgtc agctcggccc atcgccccct gcacctgtcc ccactcggtc tactcccccc 
10^2^"^" ccaaggatgc tcagaggcct gcccagtcat tggaggagct gaggctgctc 
tggagccccg aggctgccca gcagtggccg atgtggaagc tgcagagcct ggggagggag 

15 

ctctgggcct ggcctctgcc ctaccctgca gcctccctga cctctgctcc tcttcccagc 
20 tol?r^""' ccgggtctgc acctccagag cccaccctac caccagacac agagcccgga 

ccacctggac ctaccctcca gccatgaccc ttccctgctc ccacccacct gactccaaat 
2^ lOalS^""*" tcccccagct ctgggcaggc ctatctgtgg ggacggaggg gctcgcaccg 

gctccctggg aggcctgctg ggagggggag ccacaaggga agctggggag atgttggacc 

30 

tagcaagggc caaaccacaa gaggcacgat gtccaacagg ctgtggggct gcgtgatgtc 
35 TotTo''^^''" ^^^-99aaga gccgccctcg gatctcaggc tcagcttggg acgggcaggg 
iSse^^^"^ gagcacttgg gaagccactg ggagggccgg agtggggaca cggcgtcaga 
TollT''''^^ tgggtccacc acagggctcc cgccccgggg gtctcagtgg gatcctccga 
tttancatcc tgngctcagt ggcatcactg gata 

45 

<210> 16 
<211> 13591 
<212> ADN 
50 <213> Homo sapiens 

<220> 

<223> Gene hOBPIIb 
55 <400> 16 

tctctgcttc tatattcggc ctccaaatct gtgctcaatg cagcaactgg agtgacccct 60 
taaatacgta agtcacagct tgcctttgtc agagctctcc agggtctttc actcagagca 120 
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10 



15 



20 



25 



gaagctgaag tcctcgtggt ggtccttaat ccctacatgg cagttccacc cactccccag 180 

cctcatgtgt ggccggtctc cctggatcat ttgctgtggc tgctctgctg tgtgttcccg 240 

gaaactgcca gcattctccc acctccaggc tggcactgga tgctcctgcc acctggactc 300 

ctcttccagc tgacgagctc atggcttgct tccttcatgt cttaaattcg gtgtttgaat 360 

gccaccttgg cggggctgtt cctcatcaat tcatttaaag gacaaataac cccttgtcct 420 

gacactcctg tccaacttgt ccactttgct ttttccatag cactgatcac catttaaaat 480 

aacgtatgaa ccagtgaccc atcaggatcc agagacaata gattgaacag ggattgcttg 540 

cacaatgaac aatcagctct agaggtttaa agagaaccac aaagaatggc tcaggattgc 600 

acgagggcag ttaaggaaga aataaacagg ggtggggatc ctttccacaa gtctgggttc 660 

agacctcatg ggagaaggtg tggttctccc aagggaagct ggagaagttt gctgggttgt 720 

cccagccaca gctggcccac ggtcagggca gaggccagca ggcagggaaa tgtaggctgg 780 

gtctggcaag caggaagcct ctctccccac ccaaggcagg tgggctgggg ctgggaagcc 840 

tgcaagagtc actgagaacc cacaggtgca gatgccactg aatctcaata ggaagccatc 900 

tgggggcggt cccctgaatt caatgtggtg tgtgccgcca gacgtccccg acttgtgcca 960 

30 ctgccatttg cataggaaga gaaagaaaaa ggaagaaatg gaagcatctg gaaccagtca 
1020 

tcctggaccc atgctaggag gcgcttctcc ctacgcctca accaacaaag cttagcattg 
1080 

caccaggtgc acaagagaag cgcctgcttg ctccagctcc attgcctcgg aaccggccat 
1140 

gaagggtacg tgtggagctg gaggcaagac attgatagct ggcactgcaa ttcacttatt 
40 1200 

tattgtgttc attttaagtc ccctgcacct agaatataag ccccccgagc acaggacatt 
1260 

tgtttcattg atcgatgtat tccttgtgcc ccaaagaatg agaggcatct agaaagtctg 
1320 

caaaaatcaa acataaaaat gaacctttat tcagtcattg ttattttgat ggaaatttga 
1380 

ggcatttcca agatttgtaa gtaacaattg aacccttctg ctggttcatg tgtgggagtg 
1440 

tatctgttga aatgatgctt ctgagtggag ttgctgagtc tttggctcta ggtttttttt 
55 1500 

ttttaagcat ttatgcttat tgtggttttt aaattaaaca tttaaccctg agacattgta 
1560 



45 



50 
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gattcccatg cagttgtaaa aagccacaca gagctatcat gtgtatcttc acctggcttg 
ctccagcccc aaccccagca atgacagacc tgttctccac tcctgaaatc tgctcattgc 
aagaatgtcg tctattgcaa tcataaaatt gtgggattgg cttttttttt tcctgtgcag 
catcattctc tggagattca tcccattgtt gcatttatca atagtttatt ccattttact 
tctgagtagt gctctatggt atggatgtac cacagtctgt ttaactattc acctgttgga 
ggatgtctgt gtttatagat ttgggctatg acacatgtac aggtttttgc atggacatca 
gJJ^^^" "^t^ggaca aaggcccagg ggttctattg cggggttcta tgcttgttgc 
agggtttttt tttttaaacc tgtcaagcca ttttccagaa actgtccagt ttccatgcat 
cctcaccagg cttcagtatg atcactatga tcttatctca gccaccttaa taggtatgta 
ctgatatatc atggctttta tttgcatttc actgatgact aatggtgttg agcatctttt 
catgtgttta tttgccatct gtatatcctc tctagtcaag tgtcccttca tgtcttttgt 
ttacattcta tttttgaaac tgttgagttt tgaaaaattc tttataaagt atagaaacta 
attctttgtt gaatatgtag tttgtcaata ttttctttca gtctttggct tgtcttttta 
ttctgttaac agggtctctt acagagcaaa aggtttttat tttgatgaag tctattttaa 
caatttttcc ttttatggat catatttttg gtgacacatc taaaatctcc tgacccagct 
ccatatccca aagattttct ttctgttttc taaagctttt atagttttaa gttttatgtt 
taagtctatg atccattttg agttaatttt cttgcagggt gtgagaccaa ggttgtggtt 
cttctttttg tttggtggtt ttgtctgtgg atgtccagtt aatccagccc atttgctaca 
aaagctatct tccattgaat tgcttttgca tctttgtaaa aacttaactg ggtatatgcg 
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tgcaggtctg tttgaggatt ctttattgtc tgtcccattg atctatgcat ctgtccatct 
2760 

gctagctata taatgagtct tgaaagggta gcctgtagct gggtatggtg gtgtgcatct 



gtaatcccag ctacttggga ggcggaggca ggagaatcac ttgaatctgg gaggtggagg 
2880 

10 ttgcaatgag tcgagattgt gctactgcac tccagcctgg gtgacagagc aagactctgt 
2940 

ctctaaaaaa aagaaagaag aagaaaagga aagaaagggt agcctgattc ctcccacttt 
3000 

15 

attcttaaaa aaaaaagttt tagttattct agttcctttg cctttccata taaatgttag 
3060 

aataatcttg tctatgtcta caaaaattcc ttctggaatt ttgatagaaa ttgtgttaaa 
20 3120 

tctttatatt atttgagaga aatgacgctt ttattatgtt gagtctccta atccatggat 
3180 

25 atagcacatc tctccatttg tttagatctt ctttgattta ttttataatc attgcattat 
3240 

tttcagcata caaatccagc atatgggttg ttaaacttat gcctaggtat ctcttttttt 



tagccactat aagtagtatt gtgtttttaa gtttagggtc cgttactagt atgtagacac 
3360 

acaattgatc tttgtatatt tatcttgtat cctgcaacct tgctgaactc gcttaatagt 
35 3420 

tctaggaggt gtattgtttt cttttgtttt gtttttcagt ttcttgggat tttctacaga 
3480 

40 gacaatcatg tcatctgcag atgcagacag ttttcttcct tcctttccaa tttgtatgtc 
3540 

tttaatttcc tttttaaaaa acctttattg ctctgactag aactttctgt actatgttaa 
3600 

45 

atacaagtgg tgaaagtgga catccttgcc ttgtccctga tgttaaggag aaagcgtttg 



taactgagta tcccagcctc aaaatgtgct taaaaacttt tttcctttct tgctttcagc 
50 3720 

cttgaaacat acttcgaaac tctttatttc tccctttccc accaggcact tctgtgagca 
3780 

55 gtgctcgctt atctaattat gtgcttactt agaaattcca ggggccaatt ttgaaacaaa 
3840 



5 



2820 



3300 



30 



3660 
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ccaggcagag agacccagct gcagaatcct ccctcttagg gggagttaca ggtagcctac 
cacttcccgg ctgaaatcag gatgactcaa accagacctc tggacagacg attaatgact 
catgataacc attggaacaa gatgcagacc aacatcctcc tgcaccattc ccacatattt 
cccacacctt ttcctcctta aaccccttcg ctcagtccag aaagtttgaa tggtctttta 
aaggcatggg gcctggccat tcctctactg ctagcatttg aataatgctg ctttcctttc 
accacacttc acttctcatg ccttgacttc tgagcagcga gcagctggac ttgagccagt 
tacacatcag tctttcacca tgagaaatga tgttagccat aggttttttg tagatgctct 
ttgtcaagtt aaggaggttc tcttctattc ctacttttct gagagttgtt ttcctgaatg 
cgtgatgaat ttagtcaagt actttttctg cattgatcga tatgatcatg taatttttct 
tcttaacata ttaatatggt tgatttttga gtattgtacc aggtttccat ccctggaata 
aactgctttt ggtcatggtg tagaattaat tttatatatt attatttgct aatattttgt 
aaaggatttc tgtatctata ttcatgaggt atattgttct gcagctttcc tttttgtgtt 
gtcaggtttt ggttgggaga tattctctca tcttctgaga ttatgcagag ttggtgttat 
ttatttttta aatggttggt agaattttct aatgaaacca tatggacatg aagaattatt 
tttggaagct tttaaaatta aaatgttaac tttaattgtc atagagctat taaagttatc 
tatcttatat tggcattgtg ttttttgaga aattggttca tttcacctat gttgtcaaat 
atatgtggga aggtctcttc gtagtattcc cttattatcc tttgatgtct gcagggtctg 
tagtgatagt ctctgttttg ttccagatgt tggttatttg tgtctttctt tctttttttg 
IteT''^^^'' *'^''*=^^9aac tgcctcaatt ttattaattt ttccagagaa ctaacccttg 
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tttcattgtt tttctctgtt gtttttctgc tttcgatttt ttctgctttc tgcttttgat 
5040 

ttattaattg ctgctcttat ctttgttatt tcttttcttc ttgctttggg tttattttgc 
5 5100 

tcttcttttt ctaggttctt gaagtgggag cttagatagt tgattttgga cttctctttt 
5160 

10 ctaatatatg catttaatgc ctctcagcac tgatttagct gtgtctcaca aattttgata 
5220 

tgtttttgtt tgtttgtttt tgaggtagag tctcgctctg tatcccaggc tggagtgcag 
5280 

15 

tggcactatc ttggctcact gcaacctcca cctcctgggt tgaagtaatt ctcctgcttc 
5340 

agccccctaa gtagctggga ttacaggtat acgccaccat gcccagcaat ttatttattt 
20 5400 

atttattttt gtatttttag tagagatgag gttttgtcat gctgtccagg ctggtctcga 
5460 

25 actcctgacc tcaagtgatc tgcccacgtg gggctccaaa gcactgagat tataggcata 
5520 

agccactgtg cccagcctgt ttttgttttt tttgagatgg agtcttgctc tgtcacccag 
5580 

30 

gctggagtgc agtggcatga tagcccactg caacctccgc ctcccgggtt caagtgattc 
5640 

tcctgcctca gcctcccgat tagctgggat tacaggcgtg caccaccaca ctcagctagt 
35 5700 

ttttgcattt ttggtagaga tgggttttcg ccatgttggc caggctggtc tcgaattcct 
5760 

40 gatcgcaagt gatccacccg cctgggcctc ccaaagtgct ggaattatag gcacaagcca 
5820 

tcacgcccag ctgatatgtt gtattttcat tttcatccag cctagtatat ttttaaattt 
5880 

45 

accttcaggc ttcctctttg acctgtggat tattcacagg tgtgttgttt ccaagcatct 
5940 

gaagaaagat tttccattat ctttctggca ttgatttata gttagattcc atgtggtcag 
50 6000 

agactaccct ctatatcatt taaattttta aaaatttctt gaggctcatt ttctcatcca 
6060 

55 ggatatggtc tatcttggta tatattctgg tgcacttgaa aagaatgtgt gtagtgctgt 
6120 
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tgccaggtgg tgtgttctac aaatgtcaat tcgattatgt taattgatgg gtggccgagt 
tctttgatgt ccctgctggt tttctgtcta gttgctctga gagaagggta ttgaagtctc 
caactataat tgtggctttt taaatttctc ctttcagttc tgttttgctt cacatattgt 
gcagctaatg tttggtgcac acacgtttag gattactatg tcttctttgc agaatggccc 
acttattatt gtataatttc cctctctgtt aattagtctt tgttctaaag tctattttac 
ctgttattga aataatgctt ctgctttctt ttgattaatg tttatatatc ttttttcatg 
tttttacttt caacctgtct ctattgttac atttgaagta agtttcttgt agacggcata 
tagttgtata atggctttta attcactttg ccaatcactg tcatttaata tttaaaccat 
ttacatttaa tataattatt aacatgctag agtttgtatt atttttatag ggttgctata 
acaaaatact accaactggg tggcttagaa caaaaattta ttttctcaca ttctggtggc 
cagaagtctg agatcaagtg agatttggaa ggtagaaaaa ccaacaaaat atgttaatga 
tgttaccatt gtgggcaact gggactcagt ccttctgagg gccatctgag aaatagggtg 
gaaccatatt tgattgttcc acttagaagg aagagtccag accatttatc ccatcagtta 
ctatccctac agactgagga tgctgattca cttgcacatc tgggtttcat cagtgtcagg 
ggaagcacag aagaaaaggt gcaggcactt aaggtgggaa gctgtgaata cgtccgtgca 
ccaggaacga tctacaactg tggcaggtgg gccgacagcg tgggtcacca gtgccttcag 
ccaccccttg cactgcactg acccactcac acagcaaatc aagtccattt tgtaactgat 
7200*^*^*^*' 99tggccagc caccgtctct gaaataatta aaataggtgg ttggtggcac 
aggcgatggt ccctactgtg cagttggtct tgcagcctta actgagattc atcgtaagct 
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cccactctgc tccttcttgg cgtgcctcag tcccagccag cacatgctct ggtctaggtg 
7320 

cttgtttggt ggtgccatct aaaccttctt atgcccaggt gtcgagtaaa gcccagacac 
5 7380 

tgtccacttc agtgaagcac ctaggaatta gcagccctga aaagctgtga tcactgtgag 
7440 

10 attcaaagaa aagggtcgtg agggaagtgg tgagagagaa agttgtgtgg tagcggcagc 
7500 

ccaacaggag ccaccatcag aaggaacaca gccatccaga gaagtgcccc aggccacaaa 
7560 

15 

gcactggggg ccagagatct cacccctcat gtctgccatg ggttgacccc caacctccag 
7620 

ccctaccatc tcctgacggt gtctgcacca gttgaaccca accagtatct aaaaggacac 
20 7680 

agttggcgaa tgagactggg acacagggca agatgggtgg atgatgggag actcctggag 
7740 

25 agcacccgtc gcactgagcg tggacctcat gggagagccc tgttctctga agcatctgtg 
7800 

catgtcgttc cagcattttc ttcaaggatt gagccagcag caccagtgtt gtaaggtgct 
7860 

30 

tagatcaatg attcacaaac aaccaatgaa atacgaggtg cctggggtac agtcaacaaa 
7920 

cacagagaac agagaaacct tcccgttgat gtagagactc cagcctgttt gctcatctct 
35 7980 

ggtcctgaag agcccaggcc ccattctttc ctgcccgggg ggatgagggt ggggggrtttc 
8040 

40 tgcttggcag cacttgccgt gggaggggtg agggactggg tcacgccagc ccgttcgtta 
8100 

cagccccagg gtttattaga gtgtgcatta gtattattga gtaagtactt gagagtgtct 
8160 

45 

gatcttgggc cagagaggca caaagatgcc attgtgtggg tccagcacct gcctgcagag 
8220 

cgtgggtcag ccttgggtcc cagggaagat gacacacacc tgggaaatgc agggtccggg 
50 8280 

agggagaagg caaagttctg gctcaggttg gctggggatg aggccagcag agccaggtgc 
8340 

55 ccaagggacc tcagccacga actctgagca caggctggca ggtgactctt ggtgcctcat 
8400 
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gcgacttgtt tatctaaagg gatgagattc aaggcctgtc ctgggggctg ggggccgtca 
aagctgacga gagaggggaa tgtatattct aacagggaga tggtcgatga atacgtgcag 
gaagaaatgg acaggacaat ccagagagat cgcgtgttct gaggacagca cagccaggct 
ccggtacgga gtgaagcggg gtcggggagg cggcggggtc cctcatatgg cccgaggagg 
ccgtatataa actgaccctg agccacaaaa tagtgccctc ctctgcccct aggaagctcg 
agtgcagggt ccaggtgggg aaaatcaatg cagagtgggt cccagagtgg gcggaagctt 
20 8820^''^^^^ gcgtgcggga ctcagctggc agcagcccca cgtctctctg gttctaaagc 

ccagtccatt tctgctcagc agggagatgg ccagttcccc agaggacttg cccagggtcc 
o 8 o 0 

oo?o*^^^^^*^ cctgggaggg tgcaggggtt ggtgagggag tatcccgagg ctgtgggccc 

8940 

9000^°*^^*^^ gcttggggtg cagatggaca ccaccctgcc ctgtcctctc gagtcctctg 
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ggctcatctg agtgggcgcg ttcgggtggt gcaaactctg gatggcatcg tgtgtctttt 
9060 



cttctctggc tggcactgac ttgctgttca ccagatgcca gcaatgagga cactccccct 
35 9120 



cccggatgca ggactggttg ccaccatggg gaggggtgca ccgtgccacg tgctcccaaa 
9180 

acactggcca gggggctata aagaacatct cgagaggagc cagcacagcc ttgttcaoac 
9240 

gcccagtgac ctgccgaggt cggcagcaca gagctctgga gatgaagacc ctgttcctgg 
9300 

|^9tcacgct cggcctggcc gctgccctgt ccttcaccct ggaggaggag gatgtgagct 



50 9420*^^^^^^ gggcggatgg aggagccagg cggactcctg ggcagggggc agtgccaggg 

gccctgcttt aggaggtgtc actgaaggct ggcttctgac cccgtgctcc cagcctagaa 
9480 ^^^^ 

55 ^gg^ggtgga ggggtcctat tgttcctcca gcagacacgg ccccccgagg cccagggccg 



15 



30 
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gagcaggctc gtctcagggg ttcctgctgc actgacgcct gaagcccgaa ggtctcgcag 
9600 

ggttgggccc tgtggaggga gggctcacct ggtgctgggg cccgggggtc catggggtgc 
5 9660 

agacatgccc tccttccact gggggctggg agccctgagc agggggctgg ctctaactca 
9720 

10 ctccagctga gctctaacta aggtgcagga acacagcctg cctttaaggg cagcagccgg 
9780 

gcaccatggg tgtctggtta tagctgcagg cctgagtgcc agggtcagag tagaatctgg 
9840 

gccacccatg gtgggctcac ggccttggcc tgctccagat cacagggacc tggtacgtga 
9900 



aggccatggt ggtcgataag gactttccgg aggacaggag gcccaggaag gtgtccccag 
20 9960 

tgaaggtgac agccctgggc ggtgggaagt tggaagccac gttcaccttc atgtgagtgt 
10020 

25 tgcccactgc agggcccctc aggccacttt cgctcccctc cccagaccca cctggtgccc 
10080 
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attgccccat ccacgtttcg ggtgttggga agagtcaccc cctgccttgg agggaaacag 
10140 

cctgggcatc ctgaagctcg gtggggtggg ggacagtgga attttcaggt tgccgggtca 
10200 



gggccatgca ccaggtgagc tgaggatggg ccatgggtgt cctgggagcc gctgcccgcg 
35 10260 

tgtctcctgt tttccaggag ggaggatcgg tgcatccaga agaaaatcct gatgcggaag 
10320 

40 acggaggagc ctggcaaata cagcgcctgt gagcccctcc cccactccca cccccaccct 
10380 



cccccaccgc caaccccagt gcaccagcct ccacaggtag agagtgccca ggctgccctt 
10440 

ttgccagggc cccagctctg cccacctcca aggaggggct ggcctctcct tcctgggggg 
10500 



ctggtggccc tgacatcaga caccgggtgt gacaggcttg tccgcagtcg agatggacca 
50 10560 

gatcacgcct gccctctggg aggccctagc cattgacaca ttgaggaagc tgaggattgg 
10620 

55 gacaaggagg ccaaggatta ggtacgggga ggctgagggt tagggatggg gaagctgagg 
10680 



30 
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iS^Jo^^^''^ gggaagctga gggttaagga tggggaggct gagggttagg gacgggggcc 
5 lolor''^^^ gatcgggaag ctgagggtta gggatgagga ggccgagggt tagggatggg 
llllT^^^^ gttagtgctg cggaagctga ggattagaga tggggaggct gagggggaag 
iSlIo^^^^* gggacaggga agtggggcag gagcagctgc tggagctggg aaggccggac 
lOSer*""*^ gacgtgctct ggccttgtgg ctccattact tgcattggga ccttcctgag 

15 

11040^*'''*''' tgcctccgtg tccgggtcca cactgtgcgg agcagccagg cctggctcag 
20 llioo''''^^^ gcacctgggt gaccgctgaa acattcccga gtgtttcttc atgtggcccc 

gagtgttctc tctgggaatg acccattttc tctgtcatct acagatgggg gcaggaagct 
11160 

2^ 11220^^^^^ caggagctgc ccaggaggga ccactacatc ttttactgca aagaccagca 



ccatgggggc ctgctccaca tgggaaagct tgtgggtgag gggcttgctg gggtctgcgt 
112 80 

11340^^^^^ ^^^^tctctg cctctggaag ccggtggaac cagcaccacc atgccctggc 

atgggggaaa aggaagcccc ctgtgccggc tttcatgtgc cgggcaccgc tgggcagcca 
35 11400 ^ ^ 

gtccaagtac ctgaagtggg aatgggatgg gccaggcagg gacagacatg gccctcagtg 
11460 

40 11520^^^*^^ gccaagggcc acttctgggg tctcgggtgt aggagggtca ccttaagggg 



^^l^gtcacc ttaagcgtcc taagagagct cttcatgggg cagggaccct ccagggcagg 
^g|^tggccg gtgcctctgg gagacaaggt ccctccaggt gagggctgtg accctgcagg 



50 11700^^^^^ gagctgccca ggtcccctgg ggttgccgag tggcttggag agtccccgcc 

actgtccccc ttcctgggga cctctcatct gggcagtgac tgtctcctct gtccccagtc 
11760 

55 ccacccctga gctctcatcc attctcaagt ctcctctcct gcttgtccgg tgctgggcta 
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tggccatctc ttctgtcccc ggccccaccc cagagctctg gtccactctt gggtctctcc 
11880 

ccttgtcctg gtgctgggca gtggccatct cctctgtccc cagccccacc cccgagctct 
11940 

gatccactct caggcctctc cccctgtcct ggtgctgggc cgtggtcgtc tcctttcggc 
12000 

atctgctccc tgcagggccg tgccgctgtc cccacgtcgg ctcacctggc cacctcacct 
12060 

gcaggtagga attctgatac caaccgggag gccctggaag aatttaagaa attggtgcag 
12120 

cgcaagggac tctcggagga ggacattttc acgcccctgc agacgggtga ggatggctgt 
12180 

gcccagtccc ctgtgtccct ctgctgtgtc tgtctgctat ctccagtgtc ccatgacccc 
12240 

catgtcctcc catgtccccc gcattcccca tgtgccccga gtctcctcgc aggggctccc 
12300 

gggccctgtt tagcgtcctc ctcattggag gctctgtgct ctgggctgcg atggggtctg 
12360 

gggctccgcg ctctgggctg cgatggggtc tggggctccg cactctgggc tgcgatgggg 
12420 

tctggggctc cgcgctctgg gctgcgatgg gctctggggc tctgagctct gggctgtgat 
12480 

ggggtctggg ccctggtcta gggcgccttc taatccctgg gtttttcttg gtctctgcag 
12540 

gaagctgcgt tcccgaacac tagggtgagt gagcctttag gagggcactg gacaagccca 
12600 

gagtcctggg ttcccggggt tcgagggtac atctgctctg gcccctccca tcccacacag 
12660 

ccagggagac ccccccaggg tcaggcacga ggttggcacc tcagagtctg cccacccaca 
12720 

gttcctggga cattcgggaa gtcctttgtt ttatcattcc tgcacctgcc agcccgagtg 
12780 

agggtcctcc tcggcctttc cacagcgagg cctccctccg gctccctcag gtgtcagctc 
12840 

agcccatcgc cccctgcacc tgtccccacg cggtccactc cccaccatcc acccaccaag 
12900 

gatgctcaga ggcctgccca gtcattggag gagctgaggt cgctctggag ccccgaggtt 
12960 
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^^^^agcagt ggccgatgtg ggggctgcag agcctgggga gggagctctg gccctggcct 

ctgccctacc ctgcagcctc cctgacctct gctcctcttc ccagcacagc agcccccggg 

tctgcacctc cagagcccac cctaccacca gacacagagc ccggaccacc tggacctacc 
13140 

ctccagccat gacccttccc tgctcccacc cacctgactc caaataaagt ccttctcccc 
13200 

13260^*^^^^ ^^^gcctstc tgtggggaca gaggggcttg cacccgctcc ctgggaggtc 

tgctgggagg gggagccaca agggaagctg gggagatgtt ggacctagca agggccaaac 
13320 



c^c^^g^ggc acgatgtcca acaggcctga ggggctgcgt gatgtcctgg aggggcctcc 
20 13380 

ggaagagccg ccctcaggtc tcaggttcag cttaggacag gcagggccct gggcaggagc 
13440 

25 gtttggaaag ccactgggga ggacaggagc ggggacacgg cgtcagggct gcagcagtgg 
13500 



ggccaccgca gggctcccgc ctcaggggtc tcagagggat cctccaagct cccccatttt 
13560 

agcagcctgg gctcagtggc agcactggag a 
13591 
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REVENDICATIONS 



1. Pol3rpeptide isole comiJrenant une sequence en amino-acides 
ayant au moins 90% d'identite avec les sequences en amino-acides 
SEQ ID N°2, SEQ ID N°4, SEQ ID N»6, SEQ ID N^S, SEQ ID N'lO, SEQ 
ID N''12 ou SEQ ID N'14. 

2- Polypeptide isole caracterise en ce qu'il comprend un 
polypeptide choisi parmi : 

a) un polypeptide de sequence SEQ ID N°2, SEQ ID NH, SEQ 
ID N°6, SEQ ID N°8, SEQ ID NnO, SEQ ID N'"12 ou SEQ ID N*'14; 

b) un potypeptide variant de polypeptide de sequences d'acides 
amines defini en a) ; 

c) un polypeptide homolt^e au polypeptide defini en a) ou b) et 
comportant au moins 90 % dldentitd avec ledit polypeptide de a) ; 

d) un fragment d'au moins 15 acides amines consecutifs 6\m 
polypeptide defini en a), b) ou c) ; 

e) un fi-agment biologiquement actif d'un polypeptide defini en 

a), b) ou c). 

3. Polypeptide isole selectionnS parmi un pol3rpeptide 
correspondant a la sequence SEQ ID N°2 et denomme OBPIIaa , a la 
sequence SEQ ID N''4 et denomm6 OBPIIap . a la sequence SEQ ID N"6 
et denomme OBPIIap , a la sequence SEQ ID N° 10 et denomme OBPIIba , 
a la sequence SEQ ID N°12 et denomme OBPIItp . 

4. Polypeptide selon I'une quelconque des revendications 1 a 3 
caracterise en ce qull comporte au moins le domaine Gly-Thr-Trp-Tyr. 

5. Polynucleotide isole caracterise en ce qu'il code pour un 
polypeptide selon Tune quelconque des revendications 1 a 4. 




6. Polynucleotide selon la revendication 5 de sequence SEQ id 
N- 1, SEQ ID N» 3 , SEQ ID N» 5, SEQ ID N»7, SEQ ID N»9, SEQ ID 
N" 1 1 ou SEQ ID N° 13. 

7. Polynucleotide isole caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide de sequence SEQ ID N' 1, SEQ ID N» 3 
SEQ ID N° 5, SEQ ID N»7, SEQ ID N'Q, SEQ ID NMl ou SEQ ID N«> 13 
ou dont la sequence est celle de I'ARN correspondant a la sequence 
SEQ ID N' 1, SEQ ID N' 3 , SEQ ID N' 5, SEQ ID N"?, SEQ ID N^Q, 
SEQ ID N'l 1 ou SEQ ID N" 13 ; 

b) un polynucleotide dont la sequence est complementaire de la 
sequence d'un polynucleotide defini en a), 

c) un polynucleotide dont la sequence comporte au moins 80% 
d'identite, avec un polynucleotide defini en a) ou b), 

d) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en a), b) ou c), 

e) un fragment d'au moins 15 nucleotides consecutifs, de 
preference 21 nucleotides consdcutifs, et de maniere preferee 30 
nucleotides cons6cutifs d'un polynucleotide ddfmi en a), b), c) ou d). 

8. Polynucleotide selon la revendication 7 caracterise en ce qu'il 
est marque directement ou indirectement par un compose radioactif ou 
un compose non radioactif. 



9. Utilisation d'un polynucleotide selon la revendication 8 
tant que sonde pour la detection de sequences nucleiques. 
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10. Utilisation d'un polynucleotide selon I'une quelconque des 
revendications 5 a 8 en tant qu'amorce pour ramplification ou la 
polymerisation de sequences nucleiques. 

11. Utilisation d*un polynucleotide selon la revendicadon 8 en 
tant que oligonucleotide sens ou antisens pour contrSler I'expression 
du produit proteique correspondant. 

12. Vecteur recombinant de clonage d'un polynucleotide selon 
I'une des revendications 5 a 8 et/ou d'expression d'un polypeptide 
selon I'une des revendications 1 a 4 caractdrise en ce qu*il contient un 
polynucl6otide selon I'une quelconque des revendications 5 a 8. 

13. Vecteur selon la revendication 12 caracterise en ce qu'il 
comporte les elements permettant I'expression 6ventuellement la 
secretion dudit polypeptide dans une cellule hote. 

14. Vecteur selon I'une quelconque des revendications 12 a 13 
caracterise en ce que les elements permettant I'expression dudit 
pol3rpeptide sont choisis parmi : 

a) le polynucleotide isole de sequence SED ID N'lS et SEQ ID 

N°16; 

b) un polynuciaotide dont la sequence est complementaire de la 
sequence du polynucleotide defini en a) ; 

c) un polynucleotide dont la sequence comporte au moins 80% 
d'identite avec un polynucleotide defini en a) ou en b) ; 

d) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence du polynucleotide defini en a), b) ou c). 



15. Vecteur selon les revendications 13 et 14 pour I'ejqjression 
dans les cellules eucaryotes selectionnes parmi I'ADN viral et I'ADN nu. 
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16. CeUule bote, caracterisee en ce qu'eUe est transformee par 
un vecteur selon l\ine des revendications 12 k 15. 

17. Proc6d6 de preparation dMn polypeptide recombinant 
caract6rise en ce que I'on cultive une cellule bote selon la revendication 
16 dans des conditions permettant I'expression et eventuellement la 
secretion dudit polypeptide recombinant et que Von recupere ledit 
polypeptide recombinant. 

18. Polypeptide recombinant susceptible d'etre obtenu par un 
procede selon la revendication 17. 

19. Utilisation d'un polypeptide choisi parmi un polypeptide 
selon IW quelconque des revendications 1 a 4 et 18 ou I'un de ses 
fragments, LCNl, RBP et I'apolipopmteine D comme prot6ine de liaison 
a un ligand bydrophobe de preference une molecule odorante. 

20. UtiUsation d'un polypeptide selon l\ine quelconque des 
revendications 1 a 4 et 18 ou Win de ses fragments, LCNl, RBP et 
I'apoUpoproteine D comme inhibiteur compfititif comme, agoniste ou 
antagoniste des recepteurs cellulaires aux lipocalines. 

21. Anticorps monoclonal ou polyclonal et ses fragments 
caracterise en ce qu'il est dirige specifiquement contre un polypeptide 
isole selon I'une des revendications 1 a 4 et 18. 

22. Utilisation d'un anticorps selon la revendication 21 pour la 
mise en Evidence de la presence d'un polypeptide selon I'une des 
revendications 1 a4 et 18 dans un echantillon biologique. 
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23. Precede de detection d'anticorps dirige contre hOBPII dans 
le serum humain de patient allergique et/ou asthmatlque en utilisant 
un polypeptide hOBPII. 

24. Precede pour contrdler la volatiUsation d'une odeur 
caracterise en ce qu'il comprend une etape de Uaison de ladite odeur 
avec un polypeptide selon I'une quelconque des revendications 1 a 4 et 
18, ou LCNl, RBP et I'apoUpoproteine D. 

25. Precede selon la revendication 24 caracterisfe en ce que le 
pol3npeptide est U6 aun support solide. 

26. Procede selon la revendication 24 caracterise en ce que le 
polypeptide est dans une composition liquide. 

27. Procede selon la revendication 26 caracteris6 en ce que 
ladite composition est une composition parfumee pour la peau. 

28. Procede de criblage de molecule, de preference les odeurs 
ou saveurs qui comprend de passer la molecule sur un substrat qui 
comprend un polypeptide selon IMne quelconque des revendications 1 
a 4 et 19, LCNl, RBP et I'apolipoprotdine D He audit substrat, ledit 
polypeptide Uant ladite odeur ou saveur et recuperer ladite odeur ou 
saveur depuis le polypeptide si necessaire. 

29. Procede selon la revendication 28 caracterise en ce que les 
molecules sent des pheromones humaines. 

30. Procede pour solubiUser des molecules Upophiles 
caracterise en ce qull comprend la liaison de ladite molecule a un 




polypeptide selon I'une quelconques des revendications 1 a 4 et 19, 
LCNl, RBP ou I'apolipoproteine D. 

31. Application des polypeptides selon I'une des revendications 
1 a 4 et 19, LCNl, RBP ou I'apoUpoproteine D en combinaison avec des 
acides gras alimentaires, a titre d'additif alimentaire. 



32. Application selon la revendication 31 dans le traitement des 
hyperlipidemies et de robesite. 

10 

33. Application selon les revendications 30 pour complementer 
les laits non-matemels. 



34. Polypeptide selon I'une quelconque des revendications 1 a 4 
15 et 19 en tant qu'agent de ciblage de compose pharmaceutique. 

35. Polypeptide selon la revendication 34 caracterise en ce que 
ledit polypeptide est exprime sous la forme d'une proteine de fusion 
avec une proteine permettant un adressage cellulaire specifique. 

20 

36. Polypeptide selon la revendication 35 caracteris6 en ce que 
ladite protdine permettant un adressage cellulaire specifique est 
choisie dans le groupe compose des interleukines, des cytokines, des 
lymphokines, des interferons, des facteurs de croissance, des 

25 hormones, des anticorps. 
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37. Polypeptide selon la revendication 34 caracterisd en ce que 
ledit polypeptide est associe a une molecule permettant un adressage 
cellulaire specifique. 




38. Polypeptide selon la revendication 37 caracterise en ce que 
ladite molecule permettant un adressage cellulaire specifique est 
choisie dans le groupe compose des steroides, des interleukines, des 
cytokines, des lymphokines, des interferons, des facteurs de 
croissance, des hormones, des anticorps. 

39. Polypeptide selon Tune quelconque des revendications 1 a 4 
et 19 en tant que transporteur de compose pharmaceutique. 

40. Composition pharmaceutique comprenant un compose 
pharmaceutique lie au moins k un polypeptide selon I'une des 
revendications 34 39 et un vehicule pharmaceutiquement acceptable. 

41. Composition pharmaceutique selon la revendication 40 
caracterisee en ce que le compose pharmaceutique est choisi dans le 
groupe des agents anticancereux. 

42. Composition pharmaceutique selon la revendication 41 
caracterisee en ce que ledit agent anticancereux est un isotope 
radioactif choisi parmi le groupe : I'lodei^i, ryttrium^o, rOr^^^ le 
PaUadiumioo, le Cuivre^"^, le Bismuth2i7 et I'Antimoine^n. 

43. Composition pharmaceutique selon I'une quelconque des 
revendications 40 a 42 caracterisee en ce que ledit polypeptide selon 
I'une quelconque des revendications 34 a 39 constitue une forme 
retard de dehvrance dudit compose pharmaceutique dans I'organisme. 

44. Composition pharmaceutique comprenant un vecteur 
d'expression selon les revendications 12 ou 13 et un vehicule 
pharmaceutiquement acceptable. 




45. Composition pharmaceutique selon I'une quelconque des 
revendications 36 a 42 pour le traitement du cancer choisi de 
preference parmi le cancer du sein, le cancer de I'uterus, le cancer de 
la prostate, le cancer du foie, du carcinome des cellules epitheliales 
pulmonaires. 
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RBVENDICATIONS 



1. Polypeptide isole comprenant une sequence en amino-acides 
ayant au moins 90% d'identite avec les sequences en amino-acides 

5 SEQ ID N''2, SEQ ID NM, SEQ ID N'S, SEQ ID N°8, SEQ ID N"10, SEQ 
ID N°12 ou SEQ ID N°14. 

2. Polypeptide isole caracterise en ce qu'il comprend un 

polypeptide choisi parmi : 
10 a) un polypeptide de sequence SEQ ID N''2, SEQ ID N»4, SEQ 

ID N-6, SEQ ID N'S, SEQ ID N°10, SEQ ID Nn2 ou SEQ ID N«14; 

b) un polypeptide variant de polypeptide de sequences d'acides 

amines defini en a) ; 

c) un polypeptide homologue au polypeptide defini en a) ou b) et 
15 comportant au moins 90 % d'identite avec ledit polypeptide de a) ; 

d) un fragment d'au moins 15 acides amines consecutifs d*un 
polypeptide defmi en a), b) ou c) ; 

e) un fragment biologiquement actif d\in polypeptide defmi en 

a), b) ou c). 

20 

3. Polypeptide isole selectionne parmi un polypeptide 
correspondant a la sequence SEQ ID N-2 et denomme OBPIIa« , a la 
sequence SEQ ID N''4 et denomme OBPIIap . a la sequence SEQ ID N^e 
et denomme OBPIIav , a la sequence SEQ ID NnO et denomme OBPIIba , 

25 a la sequence SEQ ID N" 12 et denomme OBPIIbp - 

4. Polypeptide selon I'une quelconque des revendications 1 a 3 
caracterise en ce qu'il comporte au moins le domaine Gly-Thr-Trp-Tyr. 
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5. Polynucleotide isole caracterise en ce qu'il code poxir un 
polypeptide selon IHme quelconque des revendications 1 a 4. 
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6. Polynucleotide selon la revendication 5 de sequence SEQ ID 
N" 1, SEQ ID 3 , SEQ ID N° 5, SEQ ID N»7, SEQ ID N"9, SEQ ID 
N'll ouSEQ ID N" 13. 

7. Polynucleotide isole caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide de sequence SEQ ID N" 1, SEQ ID N" 3 , 
SEQ ID N" 5, SEQ ID N"7, SEQ ID N»9, SEQ ID N»ll ou SEQ ID N» 13 
ou dont la sequence est celle de I'ARN correspondant a la sequence 
SEQ ID N" 1, SEQ ID N° 3 , SEQ ID N» 5, SEQ ID N"'7, SEQ ID N'Q, 
SEQ ID N'll ou SEQ ID N" 13 ; 

b) un polynucleotide dont la sequence est complementaire de la 
sequence d\in polynucleotide defini en a), 

c) un pol3mucleotide dont la sequence comporte au moins 80% 
d'identite, avec un polynucleotide defini en a) ou b), 

d) un polynucleotide hybridant dans des conditions de forte 
stiringence avec une sequence de polynucleotide defini en a), b) ou c), 

e) un ft-agment d'au moins 15 nucleotides consecutifs, de 
preference 21 nucleotides consecutifs, et de maniere prcferee 30 
nucleotides consecutifs d'un polynucleotide defini en a), b), c) ou d). 

8. Polynucleotide selon la revendication 7 caracterise en ce qu'il 
est marque directement ou indirectement par un compose radioactif ou 
un compose non radioactif. 

9. Utilisation d'un polynucleotide selon la revendication 8 en 
tant que sonde pour la detection de sequences nucleiques. 
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10. Utilisation d'un polynucleotide selon Tune quelconque des 
revendications 5 a 8 en tant qu'amorce pour I'amplification ou la 
polymerisation de sequences nucleiques. 

11. Utilisation d'un polynucleotide selon la revendication 8 en 
tant que oligonucleotide sens ou antisens poiar controler I'expression 
du produit proteique correspondant. 

12. Vecteur recombinant de clonage d'un polynucleotide selon 
l\me des revendications 5 a 8 et/ou d'expression d'un polypeptide 
selon l^ane des revendications 1 a 4 caracterise en ce qu'il contient un 
polynucleotide selon I'une quelconque des revendications 5 a 8. 

13. Vecteur selon la revendication 12 caracterise en ce qu'il 
comporte les elements permettant I'expression eventuellement la 
secretion dudit polypeptide dans une cellule bote. 

14. Vecteur selon I'une quelconque des revendications 12 a 13 
caracterise en ce que les elements permettant I'expression dudit 
polypeptide sont choisis parmi : 

a) le polynucleotide isole de sequence SED ID N'15 et SEQ ID 

N^ie; 

b) un polynucleotide dont la sequence est complementaire de la 
sequence du polynucleotide defini en a) ; 

c) un polynucleotide dont la sequence comporte au moins 80% 
d'identite avec un polynucleotide defmi en a) ou en b) ; 

d) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence du polynucleotide defmi en a), b) ou c). 



15. Vecteur selon les revendications 13 et 14 pour I'expression 
dans les ceUules eucaiyotes selectionnes parmi I'ADN viral et I'ADN nu. 
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16. Cellule hote, caracterisee en ce qu'elle est transformee par 
un vecteur selon I'une des revendications 12 a 15. 

17. Procede de preparation d*un polypeptide recombinant 
caracterise en ce que I'on cultive une cellule hote selon la revendication 
16 dans des conditions permettant I'expression et eventuellement la 
secretion dudit polypeptide recombinant et que Von recupere ledit 
pol3rpeptide recombinant. 

18. Polypeptide recombinant susceptible d'etre obtenu par un 
procede selon la revendication 17. 



19. Utilisation d'un polypeptide choisi parmi un polypeptide 
15 selon I'une quelconque des revendications 1 a 4 et 18 ou I'un de ses 
fragments, comme proteine de liaison k un ligand hydrophobe de 
preference une molecule odorante. 



20. Utilisation d'un polypeptide selon I'une quelconque des 
revendications 1 a 4 et 18 ou I'un de ses fragments, comme inhibiteur ^ 
competitif conrmie, agoniste ou antagoniste des recepteurs cellulaires 
aujc lipocalines. 



21. Anticorps monoclonal ou polyclonal et ses fragments 
caracterise en ce qu'il est dirige specifiquement conti-e un polypeptide 
isole selon I'une des revendications 1 a 4 et 18. 

22. Utilisation d'un anticorps selon la revendication 21 pour la 
mise en evidence de la presence d\in polypeptide selon l^ane des 
revendications 1 a 4 et 18 dans un echantiUon biologique. 
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23. Precede de detection d'anticorps dirige centre hOBPII dans 
le serum humain de patient allergique et/ou asthmatique en utilisant 
un poljrpeptide hOBPII. 

24. Procede pour controler la volatilisation d*une odeur 
caracterise en ce qu'il comprend une etape de liaison de ladite odeur 
avec un polypeptide selon l*une quelconque des rcvendications 1 a 4 et 
18. 

25. Procede selon la revendication 24 caracterise en ce que le 
polypeptide est lie a un support solide. 

26. Procede selon la revendication 24 caracterise en ce que le 
poljrpeptide est dans une composition liquide. 

27. Procede selon la revendication 26 caracterise en ce que 
ladite composition est une composition parfumee pour la peau. 

28. Procede de criblage de molecule, de preference les odeurs 
ou saveurs qui comprend de passer la molecvde sur un substrat qui 
comprend un polypeptide selon ^ne quelconque des revendications 1 
a 4 et 18 Ue audit substrat, ledit polypeptide liant ladite odeur ou 
saveur et recuperer ladite odeur ou saveur depuis le polypeptide si 
necessaire. 

29. Procede selon la revendication 28 caracterise en ce que les 
molecules sont des pheromones humaines. 

30. Procede pour solubiliser des molecules lipophiles 
caracterise en ce qu'il comprend la liaison de ladite molecule a un 
polypeptide selon I'une quelconques des revendications 1 a 4 et 18. 
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31. Application des polypeptides selon I'une des revendications 
1 a 4 et 18 en combinaison avec des acides gras alimentaires, a titre 
d'additif alimentaire. 

32. Application selon la revendication 31 pour la preparation 
d'un medicament destine au ti-aitement des hyperlipidemies et de 
Tobesite. 



33. Application selon la revendication 31 pour complementer 
les laits non-maternels. 



34. Polypeptide selon I'une quelconque des revendications 1 a 4 
et 18 en tant qu'agent de ciblage de compose pharmaceutique. 

35. Polypeptide selon la revendication 34 caracterise en ce que 
ledit polypeptide est exprime sous la forme d'une proteine de fusion 
avec une proteine permettant un adressage cellulaire specifique. 

36. Polypeptide selon la revendication 35 caracterise en ce que 
ladite proteine permettant un adressage cellulaire specifique est 
choisie dans le groupe compose des interleukines, des cytokines, des 
lymphokines, des interferons, des facteurs de croissance, des 
hormones, des anticorps. 

37. Polypeptide selon la revendication 34 caracterise en ce que 
ledit polypeptide est associe a une molecule permettant un adressage 
cellulaire specifique. 

38. Polypeptide selon la revendication 37 caracterise en ce que 
ladite molecule permettant un adressage cellulaire specifique est 
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choisie dans le groupe compose des steroides, des interleukines, des 
cytokines, des lymphokines, des interferons, des facteurs de 
croissance, des hormones, des anticorps. 

39. Polypeptide selon l*une quelconque des revendications 1 a 4 
et 18 en tant que transporteur de compose pharmaceutique. 

40. Composition pharmaceutique comprenant un compose 
pharmaceutique lie au moins a un polypeptide selon I'une des 
revendications 34 a 39 et un vehicule pharmaceutiquement acceptable. 

41. Composition pharmaceutique selon la revendication 40 
caracterisee en ce que le compose pharmaceutique est choisi dans le 
groupe des agents anticancereux. 

42. Composition pharmaceutique selon la revendication 41 
caracterisee en ce que ledit agent anticancerexax est un isotope 
radioactif choisi parmi le groupe : Vlode^^\ ITttrium^o, i.Ori99, le 
Palladiumioo, le Cuivree?, le Bismuth2i7 et rAntimoine2ii. 

43. Composition pharmaceutique selon I'une quelconque des 
revendications 40 a 42 caracterisee en ce que ledit polypeptide selon 
I'une quelconque des revendications 34 a 39 constitue une forme 
retard de delivrance dudit compose pharmaceutique dans I'organisme. 

44. Composition pharmaceutique comprenant un vecteur 
d'expression selon les revendications 12 ou 13 et un vehicule 
pharmaceutiquement acceptable. 

45. Composition pharmaceutique selon I'une quelconque des 
revendications 40 a 44 pour le traitement du cancer choisi de 
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preference parmi le cancer du sein, le cancer de I'uterus, le cancer de 
la prostate, le cancer du foie, du carcinome des cellules epitheliales 
pvilmonaires. 
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